ジェネレーティブAI市場、激化する競争
ChatGPTの登場で火がついたジェネレーティブAIトレンド。Gand View Reseachのレポート(2023年5月)によると、ジェネレーティブ市場は今後年平均35.6%で拡大し、2030年には1093億ドルに達する見込みだ。
同市場においては現在、OpenAIが開発したChatGPTの認知が高く、利用者も多い状況だが、競合企業による追い上げもあり、すでに競争激化の様相となっている。
ChatGPTの対抗馬としてまず挙げられるのはグーグルが展開するAIチャットサービス「Bard」だろう。最近、大規模言語モデルをより効率的かつ精度が高い「Palm2」にシフトしたことで、Bardのパフォーマンスも大幅に改善されたことが報告されている。
さらに、グーグルではOpenAIに対抗するため、社内のAI開発部門であるGoogle Brainとアルファベット傘下のAI企業ディープマインドを統合し、新ユニット「グーグル・ディープマインド」を結成、ジェネレーティブAI開発をさらに加速させようとしている。
そんな中、ディープマインドが開発した「AlphaGo」をベースとする、新たなAIチャットボットが近々登場する可能性が浮上、その動向に関心が注がれている。
AlphaGoは、2015〜2016年にかけて囲碁のトップ棋士を次々に破ったとして、当時大きな話題となったディープマインドのAIシステム。その後「AlphaZero」など同技術を活用したAIシステムが複数開発されたが、ChatGPTほど脚光を浴びることはなかった。
今回注目されているのは、AlphaGoの強みと大規模言語モデルの言語能力を合わせ持つ「Gemini」と呼ばれるチャットボットだ。
このGeminiに関して、Wiredが6月26日の記事で詳細を伝えており、他メディアもそれに追随する形でGemini関連の報道を行っている。
Wiredは、ディープマインドのデミス・ハサビスCEOの発言として、GeminiがChatGPTを凌駕する可能性があると伝えている。
ChatGPTの有料会員に提供されている最新のGPT4モデルは、推論、計算、コーディングなどで、前モデルであるGPT3.5のパフォーマンスを大きく上回り、数ある言語モデルの中でもかなり優れたモデルとして人気を集めている。GPT4をベースとするAIアプリケーションも急速に増えつつある状況だ。
Gemini、強化学習による強み発揮
ハサビスCEOによると、Geminiの強みは、戦略立案や問題解決能力にある。これらは既存の大規模言語モデルが苦手とするタスクといわれているが、AlphaGoタイプのシステムを活用することで、こうした苦手を克服することができるという。
その秘密は、AlphaGoの開発に用いられた「強化学習」とよばれるAI開発手法にある。ディープマインドは、もともと強化学習を用いたAI開発に長けたスタートアップ。2014年にグーグルがディープマインドを買収した際も、その決め手はディープマインドが開発した強化学習を用いたゲームプレイAIだったといわれている。
ChatGPTのような大規模言語モデルは、「トランスフォーマー」と呼ばれるディープラーニングアーキテクチャに基づいてトレーニングされている。書籍やウェブページなどの情報源から得られた大量のテキストをトランスフォーマーに学習させ、任意のテキストの後に続くべき文字や単語を予想する能力を高めているのだ。これにより、質問に答えたり、テキストやコードを生成することが可能になる。
一方強化学習は、望ましい行動に対して報酬を与え、望ましくない行動に対して罰を与えることで、AIシステムが特定の状況で適切な行動をとるように訓練する手法。これにより、たとえば、金融投資、事業計画、ゲームなどの文脈でシナリオ分析を行い、洞察や推奨など意思決定を支援する情報を生成することが可能となる。
こうした戦略的意思決定に加え、ほかにも様々な強化学習の利点があると考えられている。1つは、チャットボットの文脈理解能力が高まるというもの。AlphaGoは、囲碁の対戦において、ゲームの文脈を理解し、最適な一手を考え出していた。これと同じ能力をチャットボットに応用することができれば、質問の文脈を理解し、より綿密な回答を生成することもできる。またAlphaGoは、転移学習したり、知識を一般化する能力にも長けている。この特性を生かし、ある分野から得た知識を他の分野でのパフォーマンス向上に活用することで、チャットボットの適応性を高めることも不可能ではない。
Geminiは現在開発中であり、リリースまで少なくとも数カ月かかる見通しだ。また開発には数千万ドルから数億ドルの費用がかかると見込まれている。ちなみに、ChatGPTのGPT4モデルの開発コストは、1億ドル以上であったことが、OpenAIのサム・アルトマンCEOによって明らかになった。
ChatGPTの競合「Claude2」
Geminiの登場までしばらくかかる見通しだが、現時点ですでにグーグルBardのほかにも、ChatGPTを脅かすチャットAIはいくつか存在する。
その筆頭となるのが、OpenAIの元研究者らが立ち上げたAIスタートアップAnthropicが7月11日に発表した「Claude2」だ。
ChatGPTよりも詳細かつ長文での回答を生成できる点を強みとするチャットボット。同社によると、前モデルClaude1.3に比べ記憶力が向上、またコーディング、数学、推論においてパフォーマンスが向上したという。
具体的には、米国司法試験において多肢選択問題で76.5%のスコアを獲得、また大学院進学向けのテストGREでは、読解およびライティング試験で90パーセンタイル以上のスコアを獲得、さらに量的推論の項目では中央値の応募者と同程度のスコアとなった。
Claude2は、長文プロンプトへの対応能力も強化された。プロンプトへの入力数は、これまでの9000トークンから10倍以上となる10万トークンに拡大。文字数換算では、英語で7万5000ワードに相当する。平均的な人で、読むのに5時間以上かかる量となる。これによりClaude2の利用者は、数百ページに及ぶ書類をAIに読み込ませ、サマリーや分析・インサイトを得ることができるようになる。
さらにClaude2は、コーディングのスキルも向上。PythonのコーディングテストであるCodex HumanEvalでは、前モデルの56%から71.2%とスコアを大幅に向上させた。
一方で、OpenAIもプラグインの拡充やPythonと統合できるCode Interpreterのリリースなど、ChatGPTの利用拡大を狙った施策を次々と展開している。Bard、Claude2、そしてGeminiとジェネレーティブAI市場の競争はまだまだ激化することが予想される。
文:細谷元(Livit)