AI需要の高まりでGPU不足が深刻化　AI特化GPUの開発でリソース最適化がカギに

2023.8.21

4兆ドルの経済価値を生み出すジェネレーティブAI

この10〜20年の間に、インターネットとモバイルという大きなテックトレンドが起こり、経済・社会や働き方が大きく変化した。

これに続く大きなテックトレンドになると考えられているのがジェネレーティブAIだ。

マッキンゼーは最新レポートで、2045年には労働者の業務の50％がジェネレーティブAIによって自動化され、これにより生産性が高まり、最大で4兆ドル以上の経済価値が新たに生み出されると予想している。英国（2021年GDP、3兆1000億ドル）と同等、またはそれ以上の経済規模を持つ国が誕生することに相当する。

現在、ジェネレーティブAI領域では、主導権を握るための動きが民間企業だけでなく、政府アクター間でも活発化している。民間では、ChatGPTを開発したOpenAIだけでなく、最近最新のAIモデル「PaLM2」を発表したグーグル、OpenAIの元研究者らが創業したAnthropic、まやメタやアマゾンなども独自の大規模言語モデルの開発に乗り出し、競争は激化の一途となっている。

これに伴い需要が急騰しているのが大規模言語モデルの開発と運用に必須となるGPU（Graphics Processing Unit）だ。

GPUといえば、ゲーミングPCの必須パーツとして、その需給状況や価格が注目されることが多い。また、かつてはビットコインなどの暗号通貨のマイニングでも大量に使用されており、クリプト関連ニュースでも注目されることが多かった。

そのGPUがいま、ジェネレーティブAIの文脈でも多くの関心を集めるようになっている。

GPUに関する最新の話題は、ジェネレーティブAI開発での需要急騰に伴うGPU不足の深刻化だ。

GPUを供給する主な企業としては、NVIDIA、AMD、インテルなどの名が挙がるが、AI開発向けのGPUに限っていえば、NVIDIAがほぼ独占的なシェアを占めている状況。CNBCが伝えたNew Street Researchのデータによると、AI開発向けのGPU市場において、NVIDIAのシェアは95％に達するという。

好調のNVIDIA、需給バランスに問題も

NVIDIAの時価総額が最近1兆ドルを超えたとして話題となった。同社のAI向けGPUの売上が好調であることが大きく影響している。

まず2023年4月30日終了の第1四半期においては、同社の売上高は71億9000万ドルとアナリスト予想である65億2000万ドルを上回った。この大半を占めているのがAI向けのGPUの売上だ。同四半期におけるAI向けGPUの売上高は、42億8000万ドルと全売上高の60％近くを占める結果となった。こちらもアナリスト予想である38億9000万ドルを上回る。

NVIDIAのジェンセン・ファンCEOによると、2022年8月からAI向けGPUの生産をフル稼働しており、ChatGPTがリリースされた2022年末頃までは、供給に余裕があった。しかし、2023年1月頃からAI向けGPUの需要が急増、これに伴い2023年下半期の供給をさらに増やす計画であるという。

2023年5月末、NVIDIAは第2四半期の売上高が110億ドルになるとの予想を発表。第1四半期の71億9000万ドルを大きく上回るだけでなく、ウォールストリートの予想である71億5000万ドルを50％以上上回る格好となる。

NVIDIAはGPUの供給を増やしているようだが、現時点での他の報道を見る限り、需要が供給を大きく上回っており、GPU不足は当面解消する気配がない。

WCCF TECHが5月22日に伝えたところでは、NVIDIAのAI向けGPUの需要が急騰し、現在GPU価格が40％上昇、在庫不足は12月頃まで続く見込みだ。

同社がAI向けに展開するGPUモデルとしては、2020年にリリースした「A100」、2022年にリリースした「H100」の人気が高く、様々なテック企業からの注文を受けているという。

受注増に対応するため、NVIDIAはTSMCでの生産増加を進めているが、供給量はまだ足りないとされる。

ウォール・ストリート・ジャーナルが5月29日に報じたイーロン・マスク氏の発言からもGPU不足問題が深刻であることがうかがえる。OpenAIに対抗して最近新たなAI企業を設立したマスク氏は「パンデミック時にはトイレットペーパーのように簡単に入手できた（GPU）」だが、「現在、GPUを買うのはドラッグを買うより難しくなっている」と発言したという。

2023年4月には、マスク氏がAI開発のために数千から1万のGPUを注文したと報じられているが、ウォール・ストリート・ジャーナルが報じたマスク氏の発言からは、同氏もGPUの供給待ちであることが示唆される。

GPUリソースの最適化が課題、不足はしばらく続く見込み

こうした状況下、GPU不足の解消を目指す取り組みも始まりつつある。

カナダ・トロント発のCentMLは、様々なGPU上でAIモデルを最適化するソフトウェアを開発するスタートアップだ。

ジェネレーティブAIトレンドにより、テック大手などがNVIDIAのA100やH100の購入を進めている。同時に、NVIDIAも単価の高いこれらのGPUを優先的に販売する傾向があり、小規模企業がGPUにアクセスすることが難しくなっている。NVIDIAは、A100やH100の他にも価格が安いGPUを多数取り扱っているが、上記の理由で、安価のGPUが十分に活用されていない状況が生まれているという。

CentMLは、A100やH100だけでなく、より安価なものも含め、様々なGPUで効率的にAIモデルを最適化するソフトウェアを開発／提供することで、小規模企業もGPUリソースにアクセスしやすい環境を作り出そうとしているのだ。

一方、このほど13億ドルという大型資金調達を実施したスタートアップInflection AIがH100を2万2000台搭載したスーパーコンピュータを開発する計画を発表。OpenAIが開発したGPT4のトレーニングに使われたコンピューティング能力の3倍に匹敵する規模といわれている。

リソース最適化によりGPU不足を解消する取り組みが始まっているが、Inflection AIの計画や大規模言語モデル開発競争の激化などを鑑みると、GPU不足はしばらく続くことになるのだろう。

文：細谷元（Livit）