メタのジェネレーティブAI導入計画
OpenAIのChatGPTが引き起こしたジェネレーティブAIブームにより、GAFAM間のAI開発競争も激化の様相だ。
5社の中で、最も優位な立ち位置にいるのが、OpenAIに巨額投資を行ってきたマイクロソフトだろう。ChatGPTのベースとなる大規模言語モデルを独占的に利用する権利を保持、「Bing」や「Office」などのプロダクトに統合し、広く展開する準備を整えている。
この動きに直接的に反応したのがグーグルだ。社内で開発していた大規模言語モデルLaMDAをベースとするチャットボットBardの試験運用を早々に開始、最近ではモデルをより強力なPaLMに刷新したばかり。また、アマゾンもAWSの顧客基盤をフル活用し、ジェネレーティブAI領域での立ち位置を確立する動きを本格化させている。
これら3社に続き、メタの動向に注目が集まり始めている。
ザッカーバーグCEOが直近の四半期決算報告において、ジェネレーティブAIに言及、同社でも既存プロダクトにAIを導入する計画を明らかにしたためだ。
詳細は明らかにされなかったものの、ザッカーバーグCEOは、WhatsAppやメッセンジャー、またフェイスブックやインスグラムでのジェネレーティブAI活用を模索していると発言。
WhatsAppやメッセンジャーでは、ジェネレーティブAIを活用しチャット体験を刷新、フェイスブックとインスタグラムではコンテンツ作成に同テクノロジーを活用する可能性を示唆した。さらに、AIによる動画生成機能をこれらのプラットフォームに統合する可能性にも言及している。
長期的には、ジェネレーティブAIをメタバースに活用し、アバターやオブジェクトの生成、コードの生成などを実現したいとしている。
ザッカーバーグCEOの発言からは、どのようなジェネレーティブAIツールが登場するのか具体的なイメージは見えてこないが、これまでの報道によると、広告分野では、異なるオーディエンスに対し、異なるテキストや画像を用いた複数の広告バージョンを自動生成するツールが2023年中にもリリースされる見込みだ。言語、色、インフルエンサーなどの要素を、ターゲットオーディエンスの年齢、興味、居住地などに応じ調整することが可能という。
AI開発加速に向け、ハードウェア投資を強化
メタは、これまでAIに対し多大な投資を行ってきたが、大きな弱点があったとされる。それは、ハードウェアインフラが最新のAIテクノロジー開発に適合していないというものだった。
特に、ChatGPTなどの大規模言語モデルを開発するには、最新のGPUが大量に必要となる。
最近イーロン・マスク氏が独自にChatGPTの競合となる「TruthGPT」を開発する計画を明らかにしたが、これに関連してマスク氏は1万近いGPUを購入したといわれている。
メタはこの弱点を認識しており、AI開発のインフラ強化に向けてこの1年取り組んできた。ロイター通信2023年4月26日の記事によると、2022年9月頃、ザッカーバーグ氏は同社のコンピューティング能力に関して、5時間に渡る議論を行ったとされる。この議論で、メタが直面するインフラの弱点があぶり出され、インフラ強化に向けた指針が策定されたようだ。
ちなみに最近リリースされている多くのジェネレーティブAIツールのベースとなる大規模言語モデルの開発・運営では、NVIDIAが2020年にリリースした「A100」というGPUが利用されているという。GPU1つあたりの価格は1〜3万ドルほど。また、2022年にリリースされた後継モデル「H100」は、現在eBayで4万ドル以上で取り引きされている。
TrendForceの推計では、ChatGPTの開発から商業化までに、A100換算では、約3万以上のGPUが必要であることが判明。GPU1つあたりのコストを1万ドルとすると、累計コストは3億ドル(約400億円)に達する。
インスタグラムの動画機能強化に向けたAI開発
AI領域でメタが進める研究開発動向から、将来どのようなジェネレーティブAIツールが登場するのかを予想することができる。特にフェイスブックやインスタグラムとの関連で注目すべきは、画像生成や動画生成AIの開発動向だろう。
この分野でメタは2022年9月に「Make-A-Video」、また2023年4月13日に絵をアニメ化するAIツールを公開している。
Make-A-Videoは、テキストから動画を生成するツールで、将来的にインスタグラムのReelsに統合される可能性があるともいわれている。Reelsは、メタがティックトックに対抗してインスタグラムに導入した短編動画機能。短編動画に関しては、競合となるスナップチャットやティックトックがすでにAI機能を導入しており、この点でメタは遅れをとっているとみられている。
現在、テキストから動画を生成するAIツールとして広く利用されているのはRunwayが提供するGen2だろう。Gen2では、テキストから動画を生成する機能に加え、画像とテキストをAIに与え動画を生成する機能、画像から動画を生成する機能、動画と特定のスタイルを与えスタイライズされた動画を生成する機能など複数の動画生成機能を提供している。もしMake-A-VideoがReelsに実装される場合、Gen2のようにいくつかのバリエーションが追加される可能性がある。
短編動画との相性を鑑みると、絵から動画を生成するAIツールも注目に値する。これは、人間が描いた絵をAIが理解し、その絵に動きをつけるAIツールだ。大量の絵のデータを学習させることで実現した。このAIツールを活用すると、絵が人型である場合、手や足を認識し、各パーツに応じた動きを生成することが可能となる。メタは、その例として、人間のダンスに対して絵が同じ動きをする様子を公開。短編動画での利用を彷彿とさせるもので、今後この機能がインスタグラムなどに実装されるかもしれない。
文:細谷元(Livit)