GPUをめぐる大きな変化、GPU不足とNVIDIAの躍進
2024年は昨年に引き続き、生成AI関連の話題が目白押しだ。直近では、NVIDIAの株価が急騰し、2024年3月1日時点における同社の時価総額は2兆ドルに接近、2兆460億ドルで時価総額世界3位のサウジアラムコを超える寸前にある。
現在、時価総額世界1位は、3兆ドルを超えたマイクロソフト。これに2兆8,000億ドルでアップルが続く。アマゾンは1兆8,360億ドルで5位、アルファベット(グーグル)は1兆7,290億ドルで6位という順位だ。2019年4月頃、NVIDIAの時価総額は100億ドルほどで推移していた。この4〜5年で20倍に拡大した格好となる。
このNVIDIAの大躍進の背景にあるのが生成AIトレンドとGPU不足だ。2022年11月、OpenAIのChatGPTリリースをきっかけに、生成AIトレンドに火がつき、GAFAMを筆頭に、多くのテック企業が生成AI/大規模言語モデル開発の取り組みを本格化させた。
ChatGPTなどの生成AIツールの裏で稼働しているのが大規模言語モデル。ChatGPTの場合、GPT‐3.5とGPT-4が該当する。この大規模言語モデルの開発・運用で必要となるのが、グラフィックス・プロセシング・ユニット(GPU)だ。CPUに比べ並列処理に強い特性を持つGPUは、機械学習など大量のデータを扱うタスクで重宝されており、大規模言語モデル開発では必須の存在となる。
このAI開発に適したGPUの供給において市場をほぼ独占しているのがNVIDIAだ。市場シェアは80〜95%ともいわれており、特に生成AI開発においては2022年にリリースしたモデル「H100」が飛ぶように売れている。データセンター向けのGPUであり、一般的には複数のGPUで構成されるクラスターで販売されているが、1台あたりの価格は2〜3万ドルほどと報じられている。
非常に高価なGPUであるが、需要急騰と供給不足が相まってGAFAMを筆頭に昨年から争奪戦が激化。オープンソースの大規模言語モデルLlaMa2などを開発するメタ、またマイクロソフト、グーグル、アマゾン、オラクルなどが数万台以上のH100を注文したと報じられている。
市場調査会社Omdiaの2023年11月時点の推計によると、同年中に履行予定のH100の注文数は、メタが15万台、マイクロソフトが15万台でトップ、これにグーグル、アマゾン、オラクル、テンセントがそれぞれ5万台、スタートアップCoreWeaveが4万台などと続いた。
H100と1世代前のモデルである「A100」を合わせて、通年の販売台数は50万台を超えると予想されていた。これに伴いH100ベースのサーバーのリードタイムも36〜52週に上ると見込まれている。注文から実際に商品を受取るまで、9カ月から1年以上かかる計算となる。
2024年、GPUの販売台数はさらに拡大する公算だ。メタのザッカーバーグCEOは2024年1月19日、インスタグラムの投稿で、同社のAIロードマップを説明、目標を達成するには「巨大なコンピュータインフラ」が必要であると述べ、2024年中に35万台のH100で構成させるコンピュータインフラを構築する計画を明らかにした。
同社がすでに有しているA100GPUと合わせ計60万台のGPUで構成されるスーパーコンピュータが登場するという。上記Omdiaの推計が正しければ、メタは2023年に15万台のH100を購入しており、2024年にはさらに20万台を追加することになる。
また、マイクロソフト、グーグル、アマゾンなども横並びで注文数を増やすことが予想されるため、今後しばらくGPU不足の解消は見込めない状況となっている。
OpenAIサム・アルトマンCEOの7兆ドルの野望
生成AI市場のリーダーとなったOpenAIだが、同社のサム・アルトマンCEOは上記のようなAI関連ハードウェア需要を予見しており、数年前からAIチップスタートアップへの投資を行ってきた。
2018年には、NPU(neuromorphic processors unit)を開発しているRain AIへの投資を開始。その数年後、OpenAIは5,100万ドルを同社に投資する意向書に署名した。また2023年11月頃にはAIチップ開発プロジェクトのため、アルトマンCEOが数十億ドルを調達しようとしていたとの報道もあった。
ちなみにNPUとは、脳の神経構造を模倣してデザインされたコンピュータチップで、GPUと同様に並列処理に強みを持っている。GPUとの大きな違いは、GPUがもともと画像(グラフィクス)処理向けにデザインされたのに対し、NPUはAI専用チップとしてデザインされている点にある。
AI関連処理では理論上GPUを大幅に超えるパフォーマンスと圧倒的に少ない消費電力を達成できるといわれている。Rain AIは、GPUに比べ、NPUの処理速度は100倍、エネルギー効率は1万倍に達すると主張しており、実現すればGPUベースのAI産業が大きく変わることになる。
これに関連して、ウォール・ストリート・ジャーナル2024年2月8日の報道が注目されている。報道によると、アルトマンCEOは世界のチップ産業の変革に向け最大で7兆ドルを調達する計画であるというのだ。同CEOは、アラブ首長国連邦政府を含む投資家らに対し、AIチップ開発計画と資金調達の意向を明らかにしたとされる。
日本のGDP(約5兆ドル)の1.5倍近い額を調達するという途方もない計画に対してさまざまな反応がみられるが、現時点では懐疑的な意見が多い印象だ。現実的な状況を鑑みると、7兆ドルもの資金は必要ないだろうとの意見が大半。
7兆ドルは、主要なチップメーカーを200社以上買収できる額に相当する。つまりこの額で、新たに200社分のチップ生産能力を追加することが可能になるということだ。
しかし、新しい工場を開設する場合、建設にかかるコンクリート、資材に加え、工場内で稼働させるチップ製造マシンなどが必要となり、それらを調達するには数十年かかる。またチップ製造産業では、人材不足の問題が横たわっており、簡単にスケールできない状況でもある。
Quartzによると、台湾のチップ大手TSMCは米アリゾナ州に工場を新設したものの、現地で熟練人材を確保できないとし、2024年に予定していた工場の稼働開始を1年遅らせるという。
GPUスタートアップに流れ込む資金、ユニコーンが続々誕生
この状況下、GPU関連のスタートアップへの資金流入も加速しており、ユニコーン企業が複数誕生している。
GPUリソースをクラウド経由で提供しているLamdaは2024年2月15日、シリーズCラウンドで3億2,000万ドルを調達したことを発表。評価額は15億ドルに達したと報じられている。この前日2月14日には、Lamdaの競合となるTogether AIが評価額10億ドルで、セールスフォースなどから資金を調達したことがThe Informationによって報じられたばかりだ。
この分野は、2017年にイーサリアムのマイニング事業から始まったCoreWeaveが評価額70億ドルでリード。ChatGPTがリリースされた直後、CoreWeaveはNVIDIAのH100をクラウドで提供することを発表し、GPU不足が深刻化する中で存在感を高めてきた。2023年5月時点での評価額は20ドルだったが、同年12月に評価額70億ドルで6億4,200万ドルを調達することに成功した。
NVIDIAがどこまで躍進するのか、GPUの需給バランスは戻るのか、アルトマンCEOの野望はどのような展開を見せるのか、2024年も生成AI関連のトピックから目が離せない。
文:細谷元(Livit)