INDEX
ChatGPTが登場して以来、「ジェネレーティブAI」がメディア、消費者、投資家の大きな関心事となっている。この流れは、多くの企業にとっても無視できないものとなっており、事業計画に盛り込むケースが急増している。
これまで「メタバース」を新規事業の中核としてきたメタも例外ではない。
メタバースへの投資を継続しつつ、ジェネレーティブAIの開発・投資を拡大する意向を明らかにし、先行するマイクロソフトやグーグルに追いつくため急ピッチで自社のジェネレーティブAIツールの商用化を進めている。
メタでのAIの取り組みが活発化していること、また同社における一連の大規模レイオフなどから、一部メディアでは「メタバースの終焉」などともいわれているが、実際のところ、ジェネレーティブAIへの投資は中長期的に見ると、メタバースの取り組みにポジティブな影響を及ぼす可能性があり、メタの動向には一層高い関心が寄せられるところとなっている。
以下では、メタの直近の動向をまとめつつ、メタバースとジェネレーティブAIがどう結びついてくるのか、今後の展開を考察してみたい。
メタバースとAIは両輪
メタがメタバースとAIを新規事業の両輪として捉えていることは、直近の四半期報告でザッカーバーグCEOが明確に述べている。
ザッカーバーグCEOは今四半期報告で、最近われわれの事業フォーカスがメタバースから離れているとの憶測が流れているが、それは事実ではない、と指摘。その上で、われわれは、AIとメタバースに注力しており、今後も同じアプローチを継続すると明言した。
同社でメタバース事業の中核を担うのはVR・AR技術の開発などを手掛けるReality Labsと呼ばれる部門。2022年通年では、137億ドルの損失を計上、また今四半期だけで損失額は40億ドルに上り、依然利益を生み出せていない状況だ。
こうした巨額損失にも関わらず、メタの株価は最近上昇傾向にある。大きな理由は、ソーシャルメディアにおける広告収益の改善にあるようだが、AI開発を加速している点も投資家の強気心理を生み出しているといわれている。これらのポジティブな要因がメタバース事業関連の懸念を和らげ、株価上昇につながっている。
このような投資家心理がある中、ザッカーバーグCEOは今四半期報告で、AI開発がメタバース事業にも寄与するものであると強調、投資家懸念のさらなる緩和を狙った発言を行っている。
同CEOは、AIがメタバースの文脈でも重要となるテクノロジーであるとした上で、実際ARグラスのシステムはAIを中心とした次世代システムになると発言、AIとメタバースが両輪であることを強調した。
ジェネレーティブAIプロダクトリリースへ本腰
メタはこれまでに複数のジェネレーティブAI関連のテクノロジーを発表しているが、本格的な商用化を目指したものではなく、研究開発の域にとどまるものだった。
しかしChatGPTが登場して以来、グーグルと同様に、その姿勢を大きく変え、商用化を前提とするジェネレーティブAIツールのリリースに乗り出している。
メタが最近発表した広告主向けのジェネレーティブAIツールは、同社のアプローチが大きく変化したことを示す事例の1つといえるだろう。
メタは5月11日、フェイスブックやインスタグラムの広告に利用できるAI Sandboxを発表した。AI Sandboxは、広告主向けにデザインされたいくつかのジェネレーティブAIツールを実験できるプレイグラウンド。第一弾として、文章生成、背景生成、画像トリミングツールが実装された。
文章生成ツールは、ChatGPTでおなじみの機能だが、メタは広告主の利用に特化した文章生成ツールを開発。広告主はこのツールを使うことで、ターゲットとする異なるセグメントごとに最適化されたセールスコピーを生成することが可能という。
背景生成ツールは、自然言語入力により画像背景を生成するツール。背景を変えることで、キャンペーンごとにユニークな印象を与えることができるようになる。
画像トリミング機能は、インスタグラムのストーリーやReelsなどソーシャルメディアのさまざまフォーマットに適したアスペクト比で画像をトリミングする機能だ。
メタは現在、これらの機能を一部の広告主に提供し、フィードバックによる改善を進めている。7月から徐々にアクセスを拡大し、今年中にはこれら機能の一部をプロダクトに追加する計画という。
ジェネレーティブAIとメタバース
これらのジェネレーティブAIツールは、4月初旬のNikkeiAsiaの取材で、メタのアンドリュー・ボズワースCTOが言及していたもの。
ボズワースCTOは、メタバース領域におけるジェネレーティブAIの活用事例にも触れている。それは、ジェネレーティブAIによって3次元モデルを生成するというものだ。
ボズワースCTOは、これまで3次元世界をつくるには、コンピュータグラフィクスやプログラミングの知識が必要だったが、将来的にはジェネレーティブAIによって3次元世界を構築することが可能になり、自然言語で作成したい世界を説明すれば、大規模言語モデルがその世界を生成してくれるようになるだろうと発言した。
もしメタが3次元モデルを生成するジェネレーティブAIを他社に先駆けてローンチできれば、AI領域だけでなく、メタバース領域でも優位性を構築できることは間違いない。
しかし、OpenAIなどの競合も3次元のジェネレーティブAI開発に乗り出しており、今後2次元静止画に続き、2次元動画、3次元静止画、3次元動画と競争領域が拡大していくことになるはずだ。
OpenAIは、ChatGPTのリリースとほぼ同じタイミングで、3次元モデル生成AIの開発状況をまとめた論文を発表している。
これは「Point-E」と呼ばれる、テキストプロンプトから3次元モデルを生成するジェネレーティブAIツール。1〜2個のNvidia V100 GPUを使い、3次元モデルを1〜2分ほどで生成できるという。
同論文で示された結果を見る限りでは、プロダクションレベルで利用できる水準ではなく、実用化まではしばらく時間がかかると思われる。
Point-Eが3次元モデルを生成する際、オブジェクトの形状は、点の離散的な集合であるポイントクラウドで生成される。一方、一般的なCGプロダクションにおいては、メッシュ(オブジェクトを定義する頂点、エッジ、面の集合)で構成された3次元モデルを利用するのが通例となっており、ポイントクラウドの3次元モデルは実用的ではない。この点、Point-Eの開発チームは、ポイントクラウドをメッシュに変換するAIシステムを別途トレーニングしたが求める結果は得られなかったという。
ただし、2次元静止画のジェネレーティブAIツールStable Diffusionなどが短期間で驚くべき進化を遂げたことを鑑みると、3次元モデル生成領域でも予想を超えることが起こるかもしれない。
文:細谷元(Livit)