UnsplashのIgor Omilaevより

最新かつ最高峰のAIモデルと謳われている「Gemin」がこのほど発表されたものの、現在の主力対話型AI「Bard」にネガティブな報道が相次いでいるGoogle。そんな中、元Google AI研究者たちによって設立されたスタートアップPerplexity AI(パープレキシティ エーアイ)がわずか1年で評価額750億円に達したとして話題になっている。

Perplexity AIが注目される最大の理由は、Googleが支配する検索市場に、AIを活用して挑戦しようとしているところにある。ウェブインデックスと最新情報を、会話型のAIチャットボットスタイルのインターフェースと組み合わせ、チャットAIの運用において独自の大規模言語モデルを開発する技術を有している点も高く評価されているPerplexity AI。同社が開発するプロダクトに触れつつ、同社の急成長の理由を探ってみたい。

Google発のAIスタートアップ「Perplexity AI」

AIチャットボットでウェブ検索を行うことができるPerplexity AI 公式YouTubeより

この話題のスタートアップ、Perplexity AIが元Google AI研究者アンディ・コンウィンスキー、アラヴィンド・スリニヴァス、デニス・ヤラッツ、ジョニー・ホーらによって、カリフォルニアに設立されてから、まだ1年ほどしかたっていない。

しかし、基本無料であり、iOSおよびAndroid アプリでも気軽に使えることもあり、使用する人が順調に増加している。

Perplexity AIのチャットボットに質問をなげかけると、回答だけでなく、関連するフォローアップの質問も提案され、インタラクティブな複数の検索と、要約された結果を使用して、検索プロセスを通じてユーザーをガイドできるという点で従来の検索より優れており、特に複雑なトピックについて調べるときに有用だ。

ただし、無料プランユーザーの場合は4時間ごとに5件の検索に制限される。月20ドルの有料ユーザーは、1日300回以上の検索が可能だ。

自社独自の大規模言語モデル(LLM)もリリース

デフォルトではOpenAIの大規模言語モデル「GPT-4」が使われている

この2022年12月に「Perplexity Ask」として公開された対話型AI検索エンジンIは「Perplexity Copilot」と名付けられている。

これまではOpenAIのマルチモーダル大規模言語モデル「GPT-4」や、米国のAI企業Anthropic(アンソロピック)の「Claude 2」など既存AIモデルを利用していたが、最近、Perplexity AIは、フランスのスタートアップMistralのmistral-7bとMetaのllama2-70bモデルをもとにした自社独自の大規模言語モデル(LLMs)である「pplx-7b-online」と「pplx-70b-online」をリリースした。

無料ユーザーの利用には「GPT-4」が使われるが、有料ユーザーは複数の選択肢から使用する対象を選ぶことが可能だ。

「pplx-7b-online」と「pplx-70b-online」は、それぞれ70億と700億のパラメータ数(各モデルの人工ニューロン間の接続数のことで、一般的に高いほど、より高性能なモデルであることを示す。GPT-3は1,750億、GPT–4は非公開)だ。 

日本語でもスムーズに使用可能

Perplexity AIのサービスは日本語でも基本的に使用可能 Perplexity AIウェブサイトより

Perplexity AIはアメリカ発の新しいスタートアップということで、日本語でどの程度使用可能なのかは気になるところだろう。

ウェブ無料版で試してみたところ、公式サイトは英語表記だが、チャットボットへの質問と回答は、日本語を含む多言語に対応しており、日本語で問題なく使用可能。回答が英語で返ってくることもあったが、これはAIに指示すれば日本語に機械翻訳することができる。

「現在地周辺の美味しいコーヒー屋さんを調べてほしい」という質問をしてみたところ、他社のチャットボットでは、すでに完全に店を畳んでいるカフェが回答の数割を占めているといったこともあった。

一方、Perplexity AIの回答は、最近オープンした店も含む最新のもので、質問の回答に使用した情報のソースや、関連した他の質問候補も同時に表示してくれるため、非常に使いやすい印象を受けた。

「役に立つ、事実に基づいた、最新の情報」の提供を目指す

Perplexity AIが急成長している理由として、この情報の新しさが挙げられることが多い。

たとえば、パラメータ数ではPerplexity AIの独自モデルを大きく上回るGPT-4だが、ChatGPTの学習データは最新の大規模言語モデル「GPT-4Turbo」であっても、2023年4月までの対応となっている。2023年9月下旬に、OpenAIパートナーであるマイクロソフトのBing検索を経由してChatGPTにウェブ閲覧機能が戻ったとはいえ、時事問題やニュース速報への対応に関してはPerplexity AIに強みがあると言えるだろう。

Perplexity AIは、最近の情報を取り込む独自のアプローチを行っており、社内の検索およびインデックス作成、クローリング・インフラストラクチャにより、最も関連性が高く、最新で価値のある情報でLLMを補強することが可能であると述べている。

提供される情報には出典が明示される

不正確な回答が批判されているGoogleのBardなど、生成AIにはまだ問題も多い

Perplexityの強みとして、情報のソースを明示してくれる点も挙げられる。

AIの進化は目覚ましいが、誤情報拡散などのリスクはかねてから指摘されている。現在のAIの限界として、とても自然な形で誤った結果を表示することがあるため、「平気で嘘をつく」などと揶揄されることもあり、GoogleのAI「Bard」も、社内で「病的な嘘つき」などと表現され批判されていたことが報道された。日本語での回答表示には、ソース元が他言語の場合、AIによる翻訳がなされる。機械翻訳の精度が日々向上しているものの、いまだ翻訳ミスはかなりの頻度で生じている。

その点、Perplexityの情報元をたどって確認できるという機能は有益だといえる。

ウェブ検索をより精密に行える「Focus オプション」など使いやすさにも工夫

また、Perplexity AIを使った検索には、回答のソースを限定できる「Focus オプション」もあり、回答生成の精度を高める機能を提供している。

検索をする際にこのオプションを選ぶことで、学術論文などアカデミックなソースによって生成された回答、インターネットの情報源に依存しない回答、WikipediaやYouTube、Redditなど特定のプラットフォーム上の回答の中などから、自由に情報源を選択できる。

他にも、文章作成やプログラミングのプログラミングコード生成に特化した設定をすることも可能だ。

「AIチャットボットといえばChatGPT、ウェブ検索といえばGoogle」という現状に果敢に挑戦するPerplexity AIの今後の展開が楽しみだ。

文:大津陽子
編集:岡徳之(Livit