AlphaGo開発のディープマインド、グーグルAI部門との統合で汎用AI開発を加速 | AMP[アンプ]

INDEX

かつて囲碁界のトップ棋士を破ったとして一躍注目を集めたAI「AlphaGo」を開発した英ディープマインドだが、最近のジェネレーティブAIトレンドにおいては、同社の動向はあまり報じられていない。

しかし水面下では、ジェネレーティブAIを含めたAI領域で着実に研究開発を進めており、今後もしかするとOpenAI以上に脚光を浴びる可能性もある。アルファベット傘下のAI開発企業ディープマインドの最新動向をまとめてみたい。

グーグルAI部門に統合されたディープマインド

AlphaGoを開発したディープマインドは、現CEOのデミス・ハサビス氏が2010年に、シェーン・レッグ氏、スタファ・スレイマン氏とともに英ロンドンで設立したAI企業。2014年にグーグルが5億ドルで買収、翌年のホールディングス化に伴い、アルファベット傘下となった。この買収で、グーグルは独自のAI開発チームGoogle Brainとディープマインドの2本の柱でAI開発を進める体制を整えたことになる。

Google Brainは2011年にグーグルの研究者グレッグ・コラード氏とスタンフォード大学のアンドリュー・ウン教授によるパートタイム研究コラボレーションをきっかけに発足した社内のAI研究開発チーム。AIモデル作成フレームワークであるTensorFlowの開発やGoogle翻訳の精度改善などで実績を残している。

基本的に研究トピックは異なるもののディープマインドとGoogle Brainチームは協力関係にあったとされる。しかし買収された後も、ディープマインドの独立志向は強く、同社経営陣らは研究の自律性を求める交渉をアルファベットと数年間に渡り実施してきた。しかしこの交渉は2021年5月に終了した。

買収後のディープマインドにおいては、増大するコストが課題となっており、アルファベットとの交渉においても、これが不利に働いた可能性がある。コスト増大の主な要因は、巨大なAIモデルのトレーニングに必要となるコンピューティングパワーの確保や約1000人に上る従業員の給与だ。2019年には、親会社であるアルファベットがディープマインドの負債約11億ポンドを帳消しにしたと報じられている。2020年にようやく黒字化を達成したが、その利益はわずか4400万ドル。収益の大部分は、自動運転車開発のWaymoなど同じアルファベット傘下の企業への技術ライセンス供与に依存したものであった。

このような背景を持つディープマインドだが、ChatGPTの登場をきっかけとするAI開発競争の激化に伴い、同社の研究開発体制は大きく変化している。

2023年4月20日、グーグルはChatGPTを開発したOpenAIやマイクロソフトなどとの競争に対応するため、同社のAI研究部門の統合を発表したのだ。この一環で、Google Brainとディープマインドを統合し、新ユニット「グーグル・ディープマインド」を結成したことを明らかにした。この件に関して、ディープマインドのハサビスCEOは同社ブログ記事で「グーグルの製品領域全体で緊密な連携を通じてAIの研究と製品を提供する」と述べており、これまでの独自路線から、今後はグーグルのAIプロダクト開発に深く関与する方針にシフトしたことが示唆されている。

期待されるAlphaGoの進化版AI

グーグル・ディープマインドという新体制のもと、すでに様々なAI開発が進められている。

1つは、AlphaGoなど囲碁やチェスなどゲームプレイに特化したAlphaシリーズを進化させ、他の用途に応用する取り組みだ。

囲碁の世界チャンピオンに勝利したAlphaGoは、囲碁のルールをすでに知っており、人間のプレイヤーや対戦相手とのやり取りから、最善のプラクティスや戦略のセットを形成するという仕組みであった。その後継モデルとなるAlphaGo Zeroは、人間のデータなしで、自己対戦のみにより最適解を導き出すことに成功。その汎用版であるAlphaZeroは2018年に囲碁、チェス、将棋でも同様のパフォーマンスを披露した。

人間のトッププレイヤーを次々と破ったことで、AlphaGoなどへの期待が高まったが、実際に起こる問題に対し、これらのAIモデルを適用することには、大きな課題が横たわっていた。Alphaシリーズは、いずれも囲碁やチェスなど不変となるルール情報が与えられた中で、最適解を生み出す仕組みであったが、現実に起こる問題は非常に複雑であり、明確なルールは所与のものではない。このため、Alphaシリーズをそのまま現実問題に応用することができなかった。

そこでディープマインドが新たに開発したのがMuZeroというAIだ。MuZeroと以前のモデルとの大きな違いは、ルール情報を与えなくても、ゲームプレイからルールを把握し、そこから問題への最適解を導き出すことが可能という点だ。ゲーム環境のすべての側面を考慮し、何百万回ものゲームプレイを通じて、ルールだけでなく、自身の行動の評価方法などを把握できるという。

このMuZeroは、すでにYouTubeのパフォーマンス改善などに活用されている。YouTubeを通じて、毎日大量の動画がグーグルのデータセンターにアップロードされている中、コスト抑制の観点から動画データをどれほど圧縮できるのかというのが重要な課題となっている。MuZeroはYouTubeのストリームを分析することで、動画のビットレートを削減できることを発見、実際に動画品質に影響を与えることなく、YouTube動画のビットレートを4％削減することに成功したという。グーグル・ディープマインドは、MuZeroをより汎用的なツールとして、他の課題にも適用する計画だ。

このほか、AlphaZeroの進化版であるAlphaDevというAIも登場している。AlphaDevは既存のものより高速なソートアルゴリズムを発見したAIモデル。データのソート、格納、検索を高速化するアルゴリズムで、実際に適用すると、負荷を30％縮小することが可能という。オンラインの検索結果、ソーシャルメディアの順位付け、レコメンドなどに影響を及ぼす。

グーグル・ディープマインドのジェネレーティブAI開発

グーグル・ディープマインドは、YouTubeの短編動画機能Shorts向けのジェネレーティブAIをリリースしたことでも注目された。

このジェネレーティブAIは、「Flamingo」と呼ばれるビジュアル言語モデルで、Shorts動画のディスクリプション（説明文）を自動生成できる。

Shortsの短編動画は、短時間で作成・アップロードされるため、しばしば説明文や適切なタイトルが付けられないケースがある。このためメタデータが不足し、検索が非常に難しくなっているという。

Flamingoは動画の最初の数フレームを分析し、説明文を生成する。これはメタデータとして保存され、動画のカテゴリ分類や検索結果のマッチングに活用される。生成された説明文はユーザーには公開されないが、検索効率が向上することが見込まれる。

グーグル・ディープマインドでは現在、四足歩行ロボットの性能を評価するためのベンチマーク「Barkour」の開発などにも乗り出しているところ。ウォール・ストリート・ジャーナルは5月2日、ハサビス氏が汎用人工知能（AGI）が数年以内に登場する可能性があると発言したと報じている。次はOpenAIではなく、グーグル・ディープマインド発のブレークスルーが起こるのかもしれない。

文：細谷元（Livit）

グーグルAI部門に統合されたディープマインド

期待されるAlphaGoの進化版AI

グーグル・ディープマインドのジェネレーティブAI開発

voteVote

Vote