公開メモ DXM 1977 ヒストリエ

切り取りダイジェストは再掲。新記事はたまに再開。裏表紙書きは過去記事の余白リサイクル。

Deep Seek

2025-01-27 16:28:00 | 中国


中国にあるあまり知られていないAI研究所が、より安価で低性能のチップを使用しているにもかかわらず、アメリカ最高のAIを凌駕するAIモデルを発表し、シリコンバレー中にパニックを引き起こした。 

ディープシーク(DeepSeek)と呼ばれるこの研究所は、12月下旬に無料でオープンソースの大規模言語モデルを発表した。 

餅は餅屋というからね、まずはAIに聞いてみよう

DeepSeekは、他の既存のAIモデルと比較して、いくつかの特徴的な点があります。
DeepSeekの特徴
 * 強化学習中心の開発: DeepSeekは、強化学習という手法を中核に開発されており、自己学習を通じて能力を向上させていきます。これにより、より複雑なタスクや、新たな状況への適応能力が高まっていると考えられています。
 * オープンソース化: DeepSeek-R1は、オープンソースとして公開されており、誰でも自由に利用・改変することができます。これにより、研究者や開発者によるコミュニティが形成され、より迅速な発展が期待されています。
 * 高性能かつ低コスト: DeepSeekは、OpenAIのモデルと同等の性能を保ちながら、より低コストで利用できる点が特徴です。これにより、中小企業や個人でも、大規模言語モデルを活用することが容易になりました。
 * 多様なタスクへの対応: DeepSeekは、自然言語処理だけでなく、数学、プログラミングなど、幅広い分野のタスクに対応することができます。

既存AIとの違い
既存の多くのAIモデルが、大量のデータに基づいたパターン認識に特化しているのに対し、DeepSeekは、強化学習によって、より深い理解と推論能力を獲得している点が大きな違いです。

DeepSeekの活用例
 * 自然言語処理: 文書の要約、翻訳、質問応答など
 * プログラミング: コードの生成、デバッグ
 * 数学: 複雑な計算、定理の証明
 * 科学: データ分析、モデル構築
まとめ
DeepSeekは、強化学習という新たなアプローチ?!を取り入れることで、既存のAIモデルの性能を凌駕する可能性を秘めています。オープンソース化されたことで、その発展はますます加速していくことが期待されます。
より詳しく知りたい場合
DeepSeekについて、より詳しく知りたい場合は、以下のキーワードで検索してみてください。
 * DeepSeek-R1
 * 強化学習
 * 大規模言語モデル
 * オープンソース
これらのキーワードで検索することで、様々な記事や論文を見つけることができます。
ご不明な点があれば、お気軽にご質問ください。
ーーーーー

強化学習という新たなアプローチ?!とか言うが、将棋AIソフトと同じじゃない?

ーーーーー

この新たな動きは、人工知能におけるアメリカの世界的なリードが縮小しているのではないかという警鐘を鳴らし、AIモデルやデータセンターの構築に巨額の費用を投じている大手ハイテク企業に疑問を投げかけている。 

サードパーティのベンチマークテストでは、ディープシークのモデルはメタ社のLlama 3.1を上回った。
のLlama 3.1、OpenAIのGPT-4o、AnthropicのClaude Sonnet 3.5を、複雑な問題解決から数学、コーディングに至るまでの精度で上回った。 

DeepSeekは月曜日、r1をリリースした。この推論モデルは、これらのサードパーティテストの多くで、OpenAIの最新のo1も上回った。

「DeepSeekの新しいモデルを見ると、推論時間の計算を行うオープンソースのモデルを本当に効果的に行ったという点でも、超コンピュート効率的であるという点でも、非常に印象的です」と、マイクロソフトのサティア・ナデラCEOは水曜日にスイスのダボスで開催された世界経済フォーラムで語った。 「我々は、中国の動向を非常に、非常に真剣に受け止めるべきだ」。 

DeepSeekはまた、米国政府が中国に課している厳しい半導体規制をかいくぐり、NvidiaのH100sのような最も強力なチップへのアクセスを遮断しなければならなかった。 最新の進歩は、ディープシークが規則を回避する方法を見つけたか、あるいは輸出規制がワシントンの意図した締め付けではなかったことを示唆している。


「Benchmark社のゼネラルパートナーであるChetan Puttagunta氏は、「彼らは本当に優れた、大きなモデルを使用し、蒸留と呼ばれるプロセスを使用することができます。 「基本的には、非常に大きなモデルを使って、小さなモデルが賢くなるのを助けるのです。 これは実際、非常にコスト効率に優れています」。

この研究室とその創設者であるリャン・ウェンフェンについてはほとんど知られていない。 メディアの報道によると、ディープシークは、約80億ドルの資産を運用するハイフライヤー・クアントという中国のヘッジファンドから生まれた。

しかし、進出している中国企業はディープシークだけではない。 

AI研究の第一人者であるKai-Fu Leeは、彼のスタートアップ01.aiはわずか300万ドルでトレーニングを受けたと語っている。 TikTokの親会社であるByteDanceは水曜日、主要なベンチマークテストでOpenAIのo1を凌ぐと主張するモデルのアップデートを発表した。 

「PerplexityのCEOであるAravind Srinivas氏は、「必要は発明の母である。 「彼らは回避策を考えなければならなかったので、実際にはもっと効率的なものを作ることになった。

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 焚書 | トップ | 姫路城はなぜ壮麗なのか »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。