OpenAIの競合Anthropic、ChatGPTに匹敵するClaude2をリリース、その特徴や実力とは?

ジェネレーティブAIへの注目が集まる中、同分野のスタートアップに対する投資も急増している。dealroom.coによると、現在ジェネレーティブAI分野のスタートアップの合計評価額は、2020年比で6倍増加し、480億ドルに達した。

dealroom.coは、ジェネレーティブAI市場を複数のセグメントに分類しているが、その中でも最大規模を誇るのが「General Intelligence/model makers」で、この分野におけるスタートアップの合計調達額は149億ドルに達している。

この分野にはいわゆる「基盤モデル」を開発するスタートアップが複数含まれており、ジェネレーティブAI領域の中でも特に注目される存在となっている。

その筆頭は、ChatGPTの開発企業として知られるOpenAIだ。さらには、OpenAIの元研究者らが立ち上げたAnthropic、アルファベット傘下のAI企業ディープマインド、ディープマインドの共同創業者ムスタファ・スレイマン氏が立ち上げたAI企業Inflection AIなど、注目スタートアップが名を連ねる。

ジェネレーティブAI分野のスタートアップの合計評価額が480億ドルに達したとされるが、その大部分を占めているのはOpenAIだろう。2023年4月末時点の報道によると、OpenAIは最新ラウンドで3億ドルを調達、これにより同社の評価額は270億〜290億ドルに拡大したと報じられている。

OpenAIの元幹部が立ち上げたAnthropic、ChatGPTに対抗するAI開発

ジェネレーティブAIトレンドの火付け役となったOpenAIに対し、現在グーグルがBardで対抗しようとしているが、他のスタートアップも開発スピードを上げ、対OpenAIの動きを本格化させている。

その中でも特に注目されるのが、サンフランシスコを拠点とするAnthropicの動向だ。

Anthropicは、OpenAIの元研究幹部であったダリオ・アモデイ氏、ダニエル・アモデイ氏、ジャック・クラーク氏、サム・マッカンディッシュ氏、トム・ブラウン氏らが設立したAI企業。OpenAIにおけるAI開発の方向性に異を唱え、同社を退職し、Anthropicを設立した。

OpenAIのChatGPTに対抗し、Anthropicが開発しているのがチャットAIである「Claude」だ。2023年3月に初号モデルが発表され、さらに7月に最新版である「Claude2」のベータ版が米国と英国限定でリリースされた。

AnthropicはClaudeを開発するにあたり、いくつかの点でChatGPTなど競合AIとの差別化を図っている。

Claudeの特徴の1つとして挙げられるのが、同モデルに「憲法AI」が組み込まれている点だ。

ジェネレーティブAI技術を活用したチャットボットは、様々な質問に回答することが可能で、非常に便利だが、使い方次第では、危険/有害なアウトプットを生成することもできる。

たとえば、欧州刑事警察機構(Europol)の報告書は、悪意のあるユーザーが「ジェイルブレイク」という手法により、パイプ爆弾やクラックコカインの作り方をChatGPTで調べていたと指摘。また違法侵入の方法やテロリズム、サイバー犯罪などの犯罪行為に関して、ステップ・バイ・ステップのガイダンスを調べることが可能であると述べている。

一方Anthropicは、憲法AIをAIシステムのアーキテクチャに組み込むことで、Claudeに倫理的な指針である「憲法」を与え、危険または有害なアウトプットを避けるように設計している。この憲法AIは、人権文書をベースとするもので、Claudeモデルはこの憲法に基づいてトレーニングされているという。

Claudeのもう1つの特徴は、長文に対応する能力だ。前モデル(Claude1.3)ですでに他のチャットAIに比べ詳細な情報を出力することが可能と謳われていたが、Claude2へのアップデートにより、その能力はさらに進化した。

Claude2のプロンプトに入力できるトークン(情報量)は、10万トークンと、英語換算では7万5000語に相当する。Claude1.3でも10万トークンの入力ができたが、Claude2は理論上20万トークンまで拡大することも可能という。ただし、Anthropicはローンチ時点で、20万トークンのサポートは行わない方針だ。

出力におけるトークン数では、Claude1.3とClaude2で大きな違いが見られる。前者の出力トークン数は512だったのに対し、Claude2は4000トークンに拡大、英語換算で3125語に相当する量の情報を出力することが可能となった。

ちなみにChatGPTの入力トークン限度は、GPT3.5が4000トークン、またGPT4では通常8000(3万2000まで拡大可能)トークンとなっている。

GPT4とClaude2の比較

2023年7月にリリースされたClaude2、OpenAIのフラッグシップモデルであるGPT4との比較が多くの人々の関心ごととなっており、Claude2が利用可能な米国と英国では、様々な比較検証が実施されている。

キム・ガースト氏がリンクトインで公開したClaude2とGPT4の比較検証では、Claude2がGPT4にも劣らないパワフルなAIモデルであることが示された。

Claude2がGPT4に勝る点の1つがスピードだ。200語で商品説明を生成するように指示したところ、GPT4が60秒かかった一方で、Claude2は30秒でタスクを終了した。

また、GPT4が一般的な知識で勝る一方、Claude2は法律などの専門分野で高いパフォーマンスを示した。ガースト氏は、「この契約の一部を分析し、執行できない条項が含まれているかどうかを評価してください」というプロンプトを、Claude2とGPT4に与えたところ、Claude2が堅牢な法的分析を行ったと評価している。また、複雑な数学の文章問題では、Claude2は正しい解答をステップ・バイ・ステップで詳細に導いた。さらにコーディングでも、Claude2がGPT4を大幅に上回った。

事実の正確性では、現時点ではGPT4に軍配が上がる。たとえば、「オーストラリアの首都はどこですか?」と尋ねると、GPT4は正しく「オーストラリアの首都はキャンベラです」と回答するが、Claude2はオーストラリアで最大人口の都市シドニーと回答する可能性があるという。

現在、米国と英国のみで利用可能となっているClaudeだが、日本語など多言語でのパフォーマンスはどうなのか気になるところ。今後のClaudeの開発動向にも注目していきたい。

文:細谷元(Livit

モバイルバージョンを終了