【アゴラ】池田 信夫：DeepSeekはチャットGPTの脅威か？【アゴラ言論プラットフォーム】

Q. DeepSeekとは何ですか？

DeepSeek（ディープシーク）は、中国・浙江省杭州市に拠点を置く人工知能（AI）企業で、2023年に設立されました。主にオープンソースの大規模言語モデル（LLM）の開発を行っており、特に数学的推論やプログラミング能力に優れたモデルを提供しています。

DeepSeekのコスト削減と影響

DeepSeekの注目すべき点は、従来の高性能なAIモデルと比較して、開発や運用コストを大幅に削減していることです。例えば、最新モデルDeepSeek-R1は、OpenAIのo1モデルと同等の性能を持ちながら、非常に低コスト・短期間で開発されました。

DeepSeekの市場への影響

DeepSeek-R1の台頭により、半導体など米国AI関連の株価に大きな打撃を与え、これはディープシーク・ショック（DeepSeek-ショック）と言われています。この中国製生成AIの影響で、AI向け半導体の王者エヌビディア（NVIDIA）の株価は17%もの暴落を見せました。[Viva Eureka]

DeepSeekの技術的特徴

DeepSeekは、最新のAI技術を活用したマルチモーダル大規模言語モデル（LLM）であり、画像、テキスト、コードなど多様なデータを解析・生成できることが特徴です。
オープンソース戦略を採用し、多くの開発者や研究者がその技術を活用できる環境を提供しています。[Comdesk]

Q. DeepSeekがチャットGPTと同等の性能を低コストで実現できたのはなぜですか？

効率的なトレーニング手法の採用

DeepSeekは、強化学習（RL）を中心としたトレーニング手法を採用し、従来の教師あり微調整（SFT）に依存しないアプローチを取っています。これにより、モデルは複雑な問題に対して効果的な推論能力を獲得し、トレーニングコストの削減に成功しました。

「エキスパートの混合」技術の活用

DeepSeekは、エキスパートの混合（Mixture of Experts）と呼ばれる手法を導入しています。この手法では、特定のタスクを専門のサブモデルに割り当てることで、計算資源の効率的な利用を実現し、チップの需要を減らし、全体のコストを抑えることが可能となりました。

オープンソース戦略の採用

DeepSeekは、モデルをオープンソースとして公開することで、開発コミュニティからのフィードバックや貢献を活用し、開発コストの削減と技術の迅速な進化を促進しています。この戦略により、低コストでの高性能モデルの提供が可能となりました。

これらの戦略により、DeepSeekは高性能なAIモデルを低コストで提供することが可能となり、AI業界に大きな影響を与えています。

Q. DeepSeekはチャットGPTの脅威ですか？

DeepSeekは、AI業界において注目すべき競争相手と見なされています。特に、低コストで高性能なAIモデルの開発に成功しており、これは従来のAI開発のコスト構造を大きく変える可能性があります。DeepSeekの登場により、NVIDIAなどの米国テクノロジー企業の株価が大幅に下落しました。

中国AI企業の台頭による競争激化

DeepSeekの成功は、中国のAI企業が高性能なモデルを低コストで開発できることを示しており、これまでNVIDIAが主導してきた市場に新たな競争相手が現れたと市場は捉えました。これにより、NVIDIAの市場シェアや収益性への影響が懸念され、株価の下落を招きました。[The Atlantic]

DeepSeekの制約

しかしDeepSeekにはいくつかの制約も指摘されています。例えば、政治的に敏感なトピックに関する回答が制限されていることや、リアルタイムの情報取得や大規模なデータ処理において課題があると報告されています。[The Times]

ChatGPTの優位性

一方、ChatGPTは多言語対応や幅広い知識ベースを持ち、ユーザーエクスペリエンスや応答の一貫性において優れています。

そのため、現時点では、DeepSeekは特定の領域で強力な競争相手となり得ますが、全体的な性能や汎用性においては、ChatGPTが依然として優位性を保っていると考えられます。

Q. DeepSeekはChatGPTなどのデータを「盗んだ」といわれていますが、これは正しいんですか？

MicrosoftとOpenAIは、DeepSeekがOpenAIのAPIを通じて大量のデータを不正に取得した可能性を調査しています。この行為は、OpenAIの利用規約に違反する可能性があります。[Reuters]

「蒸留」技術の使用

DeepSeekは、既存のAIモデルの出力を学習データとして活用する蒸留(distillation)と呼ばれる手法を用いて、自社のAIモデルを開発したとされています。この手法により、低コストで高性能なモデルの開発が可能となりますが、知的財産権の侵害にあたるかどうかが議論されています。[AP News]

米国政府の対応

米国政府内では、DeepSeekがOpenAIの技術を不正に利用した可能性について懸念が高まっており、国家安全保障上のリスクとして注視されています。[The Guardian]

現時点では、DeepSeekがChatGPTのデータを不正に使用したとの確固たる証拠は公開されていません。しかし、これらの疑惑により、AI技術の知的財産権保護や倫理的な開発手法に関する議論が活発化しています。

Q. 汎用CPUでGPUと同等の性能を実現したDeepSeekの登場で、生成AIのエコシステムは大きく変わりますか？

DeepSeekの登場により、生成AIのエコシステムは大きな変革を迎える可能性があります。特に、DeepSeekは従来のGPUに依存しない効率的なAIモデルの開発に成功しており、これが業界全体に与える影響は計り知れません。

DeepSeekは、従来のAIモデルが大量のGPUを必要とする中、約2,000枚のNVIDIA製H800シリーズGPUを使用し、558万ドルのコストで高性能なAIモデルを開発したと発表しました。これが事実だとすると、GPT-4の1/20のコストです。

エコシステムへの影響

DeepSeekの成功は、AI開発における資源の最適化とコスト削減の重要性を示しています。これにより、より多くの企業や研究機関がAI開発に参入しやすくなり、エコシステム全体の多様性と活力が増すと考えられます。特に、従来は高価なGPUリソースの確保が難しかった組織にとって、DeepSeekのアプローチは新たな道を開くものとなるでしょう。

日本企業はChatGPTのようなAIを開発できるか

中国のDeepSeekが成功を収めたことで、日本企業もChatGPTのようなAIを開発できる可能性があります。しかし、以下の課題が存在します。

研究開発コストの問題 – AIモデルの開発には膨大なデータと計算資源が必要であり、これには相応の資金と技術力が求められます。
データの確保 – 言語モデルのトレーニングには大量のデータが必要ですが、
日本語データの規模は英語に比べて少ないため、質の高いデータセットの収集が課題となります。
競争環境 – OpenAIやDeepSeekのようなグローバル企業がすでに先行しているため、
日本企業が独自の強みを生かしたAI開発を行う必要があります。

そのため、日本企業が成功するためには、独自の価値を提供する戦略や、
国産AIモデルの強みを活かす方向性が重要になるでしょう。

結論

したがって、DeepSeekはAI業界における重要な競争相手であり、その動向は注視すべきですが、ChatGPTとしては引き続き多様なニーズに応えるための強みを持っています。また、日本企業もAI技術の進展に乗り遅れないためには、独自のアプローチでのAI開発を進めることが求められます。