生成AI市場の三強、Cohereとは

生成AI市場には、さまざまなスタートアップが混在しているが、最も強い影響力を持っているのが、大規模言語モデルを開発する企業群だ。

ChatGPTを開発したOpenAIは、この企業群に属しており、多くの資金調達に成功している。

一方、資金調達や収益規模などでOpenAIに及ばないものの、OpenAIとは異なるアプローチで事業展開を進める大規模言語モデルスタートアップがいくつか存在しており、生成AIの盛り上がりとともに、それらの企業への注目度も高まりつつある。

収益規模、評価額、調達額、大規模言語モデルのパフォーマンスなどいくつかの側面でOpenAIに次ぐ主力企業と目されているのは、Claudeを開発するAnthropicだ。メディア報道が増えており、知名度も高まっている。

ニューヨーク拠点の市場調査プラットフォームSacraの共同創業者、ジャンエリック・アスプンド氏は、生成AI市場の現状について、2010年代に起こったウーバーやLyftなどに端を発するオンデマンド市場トレンドに似ていると指摘

ハイプ・サイクルの初期フェーズでは、市場の勝者になると期待される企業に数十億ドルの資金が流れ込んだが、生成AI市場でも同様の動きが観察されるという。OpenAI、Anthropic、Cohereの3社だけで、これまでに145億ドルを調達、これが「資本の堀」となり、将来の競争における優勢性を生み出すだろうと述べている。

GPTモデルの基礎を築いた研究に携わったCohere創業者たち

OpenAIとAnthropicは米国発の企業だが、Cohereはカナダ・トロントを発祥とするスタートアップ。

創業者は、現在CEOを務めるエイダン・ゴメス氏、イワン・チャン氏、ニック・フロスト氏。3名ともグーグルのAI開発部門グーグル・ブレインに所属していた。

ゴメスCEOは、2018年にトロント大学・コンピュータサイエンス学部を卒業後、英オックスフォード大学のコンピュータサイエンス博士号過程に進学。学業の傍ら、シアトルやシリコンバレーでマイクロソフトやグーグルのインターンとして、AIリサーチに従事した経歴を持つ。

2018年にはグーグル・ブレインのカナダ拠点にインターンとして入社。AI研究の権威ジェフリー・ヒントン氏のもとで知識蒸留(機械学習の手法の1つ)などの工程を担った。

その後、グーグル・ブレインのロンドン拠点に移り、スチューデント・リサーチャーとして、トランスフォーマーズなどの研究に携わった後、2019年9月にチャン氏、フロスト氏とともにCohereを創業、現在に至る。

ゴメスCEOは、2017年に発表されたグーグルの有名なAI論文「Attention is All You Need」の共同執筆者として名を連ねており、これも生成AIトレンドの中でCohereが注目される理由の1つとなっている。同論文で提唱されたAIアーキテクチャーは、テキスト生成、要約、翻訳、質問応答などのパフォーマンスを飛躍的に向上させ、OpenAIのGPTモデルなど現在話題となっているさまざまな生成AIモデルの基礎を構築した。

同論文で提唱されたアプローチは、グーグル社内で幅広く採用されるようになったが、外部での採用はなかなか進まなかった。ゴメス氏は、この状況に業を煮やし、同アプローチの普及を目指してCohereを創業した。

同じ理由で同論文の共同執筆者だったニキ・パルマー氏とアシシュ・バスワニ氏もグーグルから独立してAIスタートアップAdeptを設立、またノーム・シェイザー氏もCharacter AIを設立した。

現在Cohereの社員数は250人(2023年9月)。OpenAIは500人(2023年10月)、Anthropicは160人(2023年7月)ほど。いずれも一連の大型資金調達により、人材採用を加速中だ。Cohereは人材確保のため、ロンドンやシリコンバレーにも拠点を構えている。

エンタープライズに特化、圧倒的な低価格で法人顧客を魅了

ChatGPTを軸にコンシューマー領域での展開に注力するOpenAIに対し、Cohereはターゲットをエンタープライズ領域に絞ることで差別化を図っている。

Cohereの強みは、大規模言語モデルのパフォーマンスに加え、エンタープライズグレードのデータプライバシーとセキュリティ、そして企業の需要に合わせた多様なデプロイ形態にある。

少し古いが2023年6月に実施された主要大規模言語モデルのパフォーマンス比較では、OpenAIのGPT-3.5とGPT-4、AnthropicのClaude、そしてCohereのCommandの4つのモデルのパフォーマンスが比較検証された。検証項目は、正確性、コンテンツ生成、問題解決、コード生成の4つ。

正確性では、GPT-4が飛び抜けたパフォーマンスを披露した一方、Commandは、GPT-3.5とClaudeに匹敵するパフォーマンスを達成。また、コンテンツ生成では、CommandがGPT‐4を上回るケースも確認された。ただし、計算問題とコード生成項目では、Commandのパフォーマンスが他モデルを下回る結果となった。

総じて、この時点では、CohereのCommandはGPT-4には及ばないものの、利用シーンによっては、GPT-4を上回る可能性があり、他の主要モデルとも概ね似たパフォーマンスを達成できることが確認されたことになる。また、Commandのアウトプット精度は、インプットにおける指示の明確さに左右されるという特徴も抽出された。

アップデートスピードが非常に速い生成AIの世界、2023年11月時点では、GPT-4のアップグレード版であるGPT-4 turboが登場したほか、ClaudeもClaude2にアップグレードされており、上記の比較結果も大きく変わる可能性があることには留意が必要だ。

大規模言語モデルのパフォーマンスでOpenAIやAnthropicと肩を並べるCohereだが、価格競争力では他社を引き離している。コストに敏感になっている企業が増える中で、Cohereの価格戦略が際立つ状況だ。

さまざまなベンチマークで優れた結果を記録しているOpenAIのGPT‐4だが、APIコストは非常に高い。入力(プロンプト)と出力(生成)でコストは異なり、3万2,000トークンを処理できる最も優れたGPT-4 32Kモデルでは、入力1,000トークンあたりの費用は0.06ドル、出力は1,000トークンあたり0.12ドル。100万トークンで換算すると、コストは入力60ドル、出力120ドルかかることになる。

Claude2は、OpenAIに比べ安いが、Cohereには及ばない。Claude2では、入力100万トークンあたりのコストは11ドル、出力は32.68ドルだ。

これに対してCohereが設定している100万トークンあたりのAPI価格は、生成モデルの入力が1.5ドル、出力が2ドル。チャットモデルも100万トークンあたり、入力1.5ドル、出力2ドルと圧倒的な低価格となっている。最近OpenAIが法人営業で苦戦しているとの報道があったが、この価格差が大きな要因になっているのは間違いないだろう。

企業の生成AI活用促進に向け、「埋め込み」モデルに注力

CohereもAIモデルのアップグレードを進めている。2023年11月には、企業における生成AI利用をさらに加速すべく、最新モデルである「Embed V3」をローンチした。

このEmbed V3は、特に企業における生成AIアプリケーション普及に重要な役割を果たすと期待されるモデルだ。

企業では、自社のデータを大規模言語モデルにインプットして、そのデータからさまざまな情報やインサイトを引き出したいというニーズがある。ChatGPTのように、「一般的な」情報を生成するのではなく、プロンプトに対し、企業特有の情報を生成する仕組みをつくり、社内で活用したいと考える企業が増えているのだ。

このニーズに対応するために最も広く導入されているのが、埋め込み(embedding)モデルを活用するアプローチだ。Embed V3は、高性能な埋め込みモデルとなる。

埋め込みモデルは、PDFなどアップロードされたファイルから抽出されたテキストデータを数値(ベクトル)に変換するモデル。これらの数値は、ベクトルデータベースに保存される。ユーザーがプロンプトを入力すると、AIシステムは、そのプロンプトを数値変換しつつ、ベクトルデータベースに保存された数値と比較し、プロンプトに最も近いデータを取得する。そのデータをコンテキストとして生成モデルに提供することで、AIがドキュメントを参照して、ユーザーの質問に答える仕組みを構築することができるのだ。

古い埋め込みモデルの場合、データセットのノイズの影響により、情報を適切に数値化できず、ユーザーのプロンプトに対して有益な回答を生成できないといった問題が多かったといわれている。

OpenAIも独自の埋め込みモデルada-002を展開。同モデルは、性能評価のベンチマークとなっているが、CohereのEmbed V3は、ada-002を上回ったという。AI開発コミュニティでも、同社の埋め込みモデルは定評がある。

OpenAIがマイクロソフトの支援を受け、Anthropicが主にアマゾン(やグーグル)の支援を受けているように、Cohereもグーグルやオラクルからの支援を受けている。生成AI市場ではAIスタートアップとテック大手による連合が形成されているが、今後の市場の動きから目が離せない。

文:細谷元(Livit