INDEX
AIモデル開発にかかるコストの実態、1年で4分の1になる事実
AIモデル開発を巡る市場の認識が大きく揺らいでいる。中国のDeepSeekが600万ドルという低コストで開発に成功したと報じられた「DeepSeek R1」の登場により、NVIDIAの株価は一時17%下落、約6,000億ドルもの時価総額が失われた。
しかし、この市場の反応は適切だったのだろうか。Anthropicの共同創業者であるダリオ・アモデイCEOは、「米国のAI企業が数十億ドルを費やしたものを、DeepSeekが600万ドルで実現した」という解釈は誤りだと指摘する。同氏によると、自社の「Claude 3.5 Sonnet」の開発費用は数千万ドル程度。DeepSeekの開発費用と比較しても、報じられているような極端な差は存在しないという。
アモデイ氏は、AIモデル開発における3つの重要な動向を説明する。1つ目は「スケーリング則」だ。これは、より多くの投資を行えば、コーディングなどの認知タスクにおいて、より良い結果が得られるというもの。100万ドルのモデルが重要なコーディングタスクの20%を解決できるとすれば、1,000万ドルで40%、1億ドルで60%というように、投資額に応じて性能が向上する。
2つ目は「カーブのシフト」。モデルのアーキテクチャ改善や、ハードウェアの効率的な運用により、同じ性能のモデルをより低コストで開発できるようになる。この効率化は年間約4倍のペースで進んでおり、DeepSeekの成果は、この自然な進化の範囲内だという。
3つ目は「パラダイムシフト」。2024年には強化学習を用いた推論チェーンの生成が注目を集め、多くの企業がこの新しい手法に取り組み始めている。現在は強化学習の初期段階にあり、比較的少額の投資でも大きな成果を得られる状況にある。DeepSeek R1は、まさに強化学習が強化されたモデルであり、この状況に当てはまるものだ。
また、アモデイ氏はDeepSeekの実際の投資規模にも言及。もし報道の通り、同社が約5万枚のホッパー世代チップを保有しているとすると、価値は約10億ドル規模に達する。これは米国の主要なAI企業と比較しても2〜3倍程度の差に過ぎないと推計している。
R1ではなく、DeepSeek V3の重要性
市場ではDeepSeek R1に注目が集まっているが、アモデイ氏によれば、より重要な技術的進歩は、その1カ月前に発表された「DeepSeek V3」にあったという。V3は事前学習モデルとして、米国の最先端モデルに迫る性能を実現。特に「Key-Valueキャッシュ」の管理面での革新的な改善や、「mixture of experts」と呼ばれる手法を従来以上に推し進めた点で、注目に値する成果を上げた。
しかし、その一方で同氏は、V3の性能面での限界にも触れている。たとえば、実際のコーディングなど、特定の重要なタスクにおいては、Claude 3.5 Sonnetが依然として優位性を保持していると指摘。また、V3の開発は9〜12カ月前に訓練されたSonnetと比較しても、多くの内部および外部評価において後塵を拝していると語る。
DeepSeek V3の開発コストについても、興味深い分析が示されている。業界の通常の進歩を考慮すると、1年前に開発された米国の最先端モデルと比較して、現時点では約4分の1のコストで同等のモデルを開発できる水準にある。しかし、V3は米国の最先端モデルと比較して性能が約2分の1程度であることを考慮すると、開発コストが8分の1程度になることは、むしろ自然な技術進化の結果だとアモデイ氏は分析している。
一方、最近発表されたDeepSeek R1は、V3ほどの技術革新性は持ち合わせていないという評価だ。R1は基本的に、V3に強化学習を加えたもの。現在は強化学習の初期段階にあり、強力な事前学習モデルさえあれば、比較的低コストで同等の成果を出せる状況にあるという。
アモデイ氏は、このような状況を「クロスオーバーポイント」と表現する。複数の企業が同等の推論モデルを開発できる現在の状況は一時的なものであり、各社がスケーリングを進めていく中で、再び投資力の差が明確になっていく可能性が高いと予測している。
とはいえ、DeepSeekの試みが中国のAI開発能力の高さを示した点は否定できない。アモデイ氏も、同社を「非常に優れたエンジニア集団」と評価。中国が米国にとって重要な競争相手であることを示す事例として位置付けている。
数年後の世界のあり方を決める輸出規制
DeepSeekの登場は、米国の対中輸出規制政策の有効性に疑問を投げかけているように見える。しかし、アモデイ氏は逆の見方を示す。むしろ今回の事例により、輸出規制の重要性は一層高まったというのが、同氏の主張だ。
アモデイ氏の予測によると、2026年から2027年にかけて、AI開発競争は重要な局面を迎える。この時期までに、「ほとんどすべての人間のほとんどすべての能力を上回る」AIの開発が現実味を帯びてくるという。そのためには数百万台のチップと、少なくとも数百億ドルの投資が必要になるが、米国の複数の企業は確実に必要なチップを確保できる見通しだ。重要なのは、中国がこれだけの規模のチップを入手できるかどうか。これが重要な分岐点になるという。
もし中国が必要なチップを確保できた場合、米中両国がAIによる急速な科学技術の進歩を実現する「二極化した世界」が出現する可能性がある。アモデイ氏は、「データセンター分野で優れた」2国が台頭するこの状況において、中国は軍事分野への応用に多くの人材や資本を注力することが可能になると警告している。
一方、中国がチップを入手できない場合、少なくとも一時的には米国とその同盟国のみがこれらのモデルを保有する「一極化した世界」が実現する。AIシステムは最終的により賢いAIシステムの開発を支援できるため、一時的なリードが持続的な優位性につながる可能性もあるという。
この観点から見ると、DeepSeekの成功は必ずしも輸出規制の失敗を意味しない。SemiAnalysisによると、同社の保有するチップは、H100、H800、H20の3種類で構成されており、その入手経路も多様だ。H100は輸出規制の対象となっているため密輸の可能性があり、H800は規制前に出荷されたもの、H20は現時点でも輸出が許可されている。このように、規制の抜け穴は段階的に閉じられており、輸出規制が機能している証左だというのが同氏の見立てだ。
アモデイ氏はDeepSeekの研究者たちを「スマートで好奇心旺盛な研究者たち」と評価し、DeepSeekそのものを敵視しているわけではないと強調している。ただし、権威主義的な政府の下で活動せざるを得ない状況に警鐘を鳴らす。輸出規制は、そうした状況下でのAI開発競争において、最も有効な手段の1つだと、アモデイ氏は結論付けている。
文:細谷元(Livit)