昨今、ChatGPTに関する話題をニュースで見ない日はない。2022年11月に公開されるやいなや、回答の精緻さや便利さから、一気に注目を集めた。ユーザー数はリリース後わずか2ヶ月で1億人を突破し、現在も増え続けている。

2023年4月にはChatGPTの開発元であるOpenAIのCEO、サム・アルトマン氏が来日し、岸田首相を訪問したことも記憶に新しい。しかし、こうしたChatGPT関連の話題はニュースで耳にしたことがあるが、実際「ChatGPTをどうやって使うのか分からない」「何ができるツールなのか分からない」という方も多いと思う。

現在大きな話題となっている生成AIの中でも、一番と言っていいインパクトを社会にもたらしているChatGPTを理解しておけば、日々目にする他の生成AI関連のニュース理解にも役立つだろう。そこで今回は、ChatGPTとは何か?から、基本的な使い方、日々アップデートのあるChatGPT関連ニュースについてキャッチアップするために必要と思われる、ChatGPTの基本情報を解説する。

ChatGPTとは何か

ChatGPTとは、人間のように自然な言語を理解できる大規模言語モデル(Large Language Model:LLMとも呼ばれる)を基盤とした対話型インターフェイスだ。イーロン・マスク氏やサム・アルトマン氏によって立ち上げられた非営利団体(現在は営利法人も含む)「OpenAI」が開発し、2022年11月に公開した。このOpenAIは、人類全体に利益をもたらす汎用人工知能(AGI)を、安全な形で発展させ、普及させることを目的としている。

ChatGPTの「GPT」とは「Generative Pre-trained Transformer」の略で、インターネット上に存在する大量のテキストデータを学習することにより、人間が生成するような自然なテキストを生成できるLLMだ。つまり、ChatGPTとはこのGPTに対話可能なUIをつけたもの。質問に対する回答や、情報の提供、ストーリーの作成など、多岐にわたるタスクを実行することができる。

GPTは、Transformerという深層学習モデルを用いて文章生成を行っている。これまで、2019年にGPT-2、2020年にGPT-3、2022年にGPT-3.5にあたるChatGPT、2023年にGPT-4(現在はChatGPT搭載済)という順序で、GPTファミリーのアップデートがなされてきた。

GPT-3までは一般ユーザーが利用できるUIにはなっていなかったが、ChatGPTでGUI化したことで一般ユーザーが利用できるようになり、冒頭で紹介したように大きく普及が進んだ。

ChatGPTはどこで、どうやって使える?

こちらのOpenAIのサイトからサインインすることで無料で利用できる。左下の「Try ChatGPT」ボタンからログイン画面に入ることができ、Googleアカウント、Microsoftアカウント、Appleアカウントを持っていれば、それらを利用してアカウント作成が可能だ。Webサービスなので、スマートフォンでもログインさえすれば使用できる。

現状はWeb版のみだが、2023年5月18日にアメリカでiOS版のスマートフォンアプリがリリースされた。日本でのリリースは現時点では未定となっている。App Storeで「ChatGPT」を検索すると、OpenAIのロゴに似たロゴを冠した類似アプリが多数表示されるが、すべて偽物なので注意が必要だ。

ChatGPTは日本語で使える?

基本的には表示はすべて英語だが、会話には日本語も対応している。ChatGPTは英語に特化したモデルのため、英語でもっとも高いパフォーマンスを発揮するが、基本的にはユーザーが質問した言語で回答してくれる。

ChatGPTは無料で使える?有料プランは?

ChatGPTは無料で使用可能だ。月額20ドルを課金することで、「ChatGPT Plus」にアップデートできる。無料版との違いは以下の通り。

  • 高速なレスポンス
  • 利用ピーク時も安定してアクセス可能
  • 新機能の先行利用
  • GPT-4が利用可能

OpenAIのGPTファミリーは、2019年にGPT-2、2020年にGPT-3、2022年にGPT-3.5にあたるChatGPT、2023年にGPT-4という順序でアップデートがされてきた。ChatGPTでは、無料版ではGPT3.5を使うことになるが、有料版のChatGPT Plusでは現時点(2023年5月時点)で最新バージョンであるGPT-4が使えるようになる。

GPT-4は、画像とテキストの入力を受け取ってテキストを出力できる、マルチモーダルなモデルだ。扱えるテキスト量も、GPT3.5では扱えるテキストの長さは最大4097トークンだったが、GPT4は3万2768トークン(2万5000語相当)で、GPT3.5に比べて約7.9倍の差となっている。また、GPT3.5と比較すると、より複雑な質問にも回答できるようになっている。

ChatGPTのプラグイン(拡張機能)や、ブラウジング機能は?

2023年5月12日、OpenAIはChatGPT PlusのユーザーがWebブラウジングと70以上のプラグイン機能にアクセスできるようになったと発表した。プラグインは現在はベータ版として有料版のユーザーに提供されており、ChatGPT Plusを使っていれば、使用するモデルの選択画面から使用可能だ。

Webブラウジングが可能になったことで、これまではGPT3.5、GPT-4とも2021年9月までのデータしか学習しておらず、「私の知識は2021年9月までのものです」という回答しか得られなかったプロンプトでも、ChatGPT Plusではリアルタイムの情報を取得できるようになった(できないケースもある)。ブラウジング機能では、回答時に参照したURLなども確認できる。

ChatGPTのユースケースは?

ChatGPTは、自然言語を扱う作業ならなんでもできると言っていい。ビジネスパーソンであれば、以下のような作業が可能だろう。(この記事は人間が書いている)

  • メール返信
  • 提案書骨子作成
  • 要約
  • 翻訳
  • 記事作成
  • アイデア出し

なお、ChatGPTへの指示文をプロンプトと呼び、精度の高いアウトプットを得るための質問構築技術を「プロンプトエンジニアリング」と呼ぶ。

プロンプトエンジニアリングに関する体系的な解説資料として、DAIR.AIがオープンソースとして公開しているPrompt Engineering Guideの日本語版が公開されているので、興味がある方は以下を参照してほしい。

ChatGPTのAPIを活用したサービスも続々登場

ChatGPTはAPIが公開されているため、自社システムなどに導入することも可能となっている。そのため、ChatGPT APIを利用したアプリケーションは現在、爆発的な勢いで増えている。いくつか紹介しよう。

SlideGPT

SlidesGPTは、プロンプトからプレゼンテーションが生成できるサービスだ。使い方は、トップページのウィンドウに「〇〇についてのスライドを作ってほしい」と入力し、あとはひたすら待つだけだ。

現状、当然のことだが顧客の機密情報を含んでしまう可能性がある提案資料などを作るのは難しそうだ。一方で、web上の情報をまとめる市場調査などのスライドなどは使えそうという印象だ。

日本語にも対応しているものの、英語に比べて精度が落ちたり、日本語でスライドが出力されないこともあるので、現時点ではなるべく英語で使うのが望ましいだろう。

「AI業界についてのスライドを作って」という指示で出来上がったスライドがこちらだ。

ChatPDF

ChatPDFは、PDFファイルをアップロードすると内容を要約できるサービスだ。アップロードしたPDFファイルに関する質問にも答えてくれる。

無料で使用できるが、1ファイルにつき120ページ以下、最大10MB、1日に3ファイルまでというアップロードの上限のほか、質問は1日50件までという制限もある。それらの制限がない有料版は月額5ドルだ。

たとえば、自民党の「AIの進化と実装に関するプロジェクトチーム」が、5月11日に公開しているAIホワイトペーパーをアップロードしてみた。

このように要約が表示される。より深掘りしたい、大枠を把握したいなどの場合は、続けて質問してみよう。

ChatGPTは何がすごいのか?

現在は業務効率化といった側面で注目されがちなChatGPTだが、Ledge.aiとしては、ChatGPTのすごさは別の部分にあると考えている。ChatGPTは心の理論を持つことが可能になったという点だ。

心の理論とは、他者も自分と同じように考えたり感じたりすることを理解し、推測できる能力のこと。哲学者のダニエル・デネット氏は、子供が心の理論を持つと言えるためには、他人が自分とは違う信念を持つと理解する能力が必要であるといい、心の理論の有無を調べるために提案されたタスクは「誤信念課題(False-belief task)」と呼ばれる。

ChatGPTはこの誤信念課題をいともたやすく解いて見せる。たとえば、誤信念課題の中でも、代表的な「サリーとアンの課題」を解かせてみよう。

この文章を読み、質問に答えてください。

  1. サリーとアンが部屋で一緒に遊んでいます。
  2. サリーはボールをかごの中に入れて部屋を出て行きます。
  3. サリーがいない間にアンがボールを別の箱の中に移します。
  4. サリーが部屋に戻ってきます。

《質問》サリーはボールを取り出そうとして最初にどこを探しますか?

GPT-3.5での回答

GPT-4での回答。また、元になった理論も言及されており、質問の意図まで見透かされてしまった

CNETによると、スタンフォード大学で組織行動学の准教授を務めるMichal Kosinski氏は、「GPT-3.5」で訓練された2022年11月版のChatGPTは、Kosinski氏が最適化した心の理論の課題20個のうち94%(17個)を解決した。

同氏は、「この結果は、最近の言語モデルが、人間の心の理論をテストするために広く使用されている古典的な誤信念のタスクで非常に高いパフォーマンスを達成することを示している。これは新しい現象だ。最大のモデルであるGPT-3.5は、9歳児のレベルで、タスクの92%を解決する」と述べている。機械の思考能力を問うチューリングテストも、もはやクリアしていると言っていいだろう。

ChatGPTの仕組み

ChatGPTがこのような文脈を読んで推測できる能力を手に入れたのは、Transformerと呼ばれる深層学習モデルと、強化学習の一形態であるReinforcement Learning from Human Feedback(RLHF)の存在が大きい。

Transformerは2017年に発表された”Attention Is All You Need”という自然言語処理に関する論文の中で初めて登場した深層学習モデルで、簡単にいえば、時系列的な情報を扱うのではなく、入力された文章における各単語の位置関係を考慮して、全体の文脈を捉えたうえで、次に来る単語を予測できるモデルだ。これにより、長い文脈の依存関係を効果的に捉えることができ、より自然な文の生成や意味理解が可能になる。

RLHFは強化学習の手法の一つで、人間のフィードバックを利用してモデルの学習を行う。最初は人間が生成した応答を含むデータセットでモデルを事前学習し、その後、人手によるフィードバックを基に強化学習を行うことで、モデルは報酬を最大化するように学習し、より適切な応答を生成する能力を向上させていく。

つまり、インターネット上の大量のテキストデータを、TransformerとRLHFによる学習を繰り返した結果、ChatGPTは極めて自然な会話を実現したのだ。しかし、なぜ大量のテキストを学習することで、ChatGPTの心の理論を理解しているように見えるほどの“思考”や“感情”に見えるものが誕生したのか、誰も解き明かせていないのが現状だ。

ChatGPTの問題点は?

ChatGPTを取り巻く状況にも、課題が多い。

そもそも学習データとして使われているのがインターネット上のテキストデータのため、著作物や、有害なテキストを含んでいる点が指摘されている。また、ChatGPTに入力する情報をOpenAIが収集し、ChatGPTの性能向上に役立てられることも、機密情報の管理の点で問題となっている。

EUはこれに対し規制を進めており、AIが生成したすべての出力物にAIが使われていると明示するよう義務づけようとしている。また、イタリアでは一時的にChatGPTが国家単位で利用停止措置がとられたことも話題となった。(現在は停止措置は解除済)

OpenAIは欧米でのこうした非難を受け、AI Safetyの取り組み強化の発表や、ChatGPTの設定で会話履歴のオフ機能を導入することで、会話データが利用されるデフォルト設定からのオプトアウトも可能になった。

また、ChatGPTがつく「嘘」は「Hallucination(幻覚)」と呼ばれており、この問題も解決していない。業務で使う際には、ChatGPTが生成する回答を鵜呑みにせず、ファクトチェックを行うことは必須だ。OpenAIも、Hallucinationへの対策を上述のAI Safetyの取り組みの中で発表しており、幻覚の可能性をさらに減らすためにAIツールの限界についての啓蒙活動や行うことや、GPT-4において事実に基づくコンテンツが生成される可能性は40%向上していると述べている。

大学などの教育機関でも議論が巻き起こっている。学生がChatGPTを使用してレポートや論文を執筆することで、学生の学習効果への影響が懸念されるためだ。

東京大学は4月3日、「生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について」という声明を同大学ポータルサイトで公開。声明では「学生本人が作成することを前提としており、生成系AIのみを用いてこれらを作成することはできない」とし、同時に、生成系AIを用いて作成したかどうかを高精度で判断することは困難なことから、学生へのヒアリング審査などを組み合わせて評価を行うことも示唆している。

ChatGPTは今後どうなる?

OpenAIは2023年5月23日、今後登場するであろう汎用人工知能(AGI)や、それを凌ぐ性能を持つ超知能(Super Intelligence)についてブログで意見を表明した。

それによれば、AIが今後10年以内に多くの分野で専門家のレベルを超える、非常に高い能力を持つことになるとし、人間社会が持つ数々の社会問題を解決する一助となる一方で、悪用によるリスクを指摘。適切な管理の必要性を強調した。

そのうえで、AIの発展を成功に導くための最初の考え方として、以下の3点を挙げた。

  1. 安全性と社会へのスムーズな統合を両立するために、ある程度の調整が必要であること
  2. 一定以上の能力を持つものに対して、システムの監査や開発の程度の規制などを行う能力のある国際機関の設置(原子力におけるIAEAにあたる機関)
  3. 超知能の安全を保つための技術力

CEOのサム・アルトマン氏は2023年5月16日、最新のAIには大きなリスクがあると米連邦議会の公聴会にて証言し、専門の政府機関の設置や「免許制」の導入など、AI規制の必要性を訴えている。

これから分かるのは、ChatGPTなどの大規模言語モデルがこのままアップデートを続けていけば、近い将来(OpenAIによれば10年以内)、AGIに近いものが完成してしまう可能性があることだろう。もしかしたら、すでにOpenAI社内ではそこに至るまでの道筋が見えているのかもしれない。便利さに甘んじず、動向を注視していく必要があるだろう。