まるで人間のような自然な会話ができるとして話題のAIチャットボットサービス「ChatGPT」。その開発元である米国OpenAI社が、懸賞金をかけることで、システムの脆弱性を一般の人に見つけ出してもらう「バグバウンティ・プログラム」を開始したとして注目されている。

研究者から技術力の高い一般人まで、誰でも参加可能のこのプログラム。報告された問題のレベルに応じて報酬は異なるが、重大なバグには最高で2万米ドルの報酬が支払われるようだ。

この取り組みの背景には、ChatGPTがこれまでバグ問題に悩まされていること、また「バグバウンティ」が様々な企業に取り入れられ、広く行われるようになっていることがある。

UnsplashShantanu Kumarより   

テック企業が次々と導入する「バグバウンティ」(バグ報奨金制度)

バグやその他のセキュリティ上の欠陥を報告したユーザーに対して報酬を支払う「バグバウンティ」は、ここ数年の急激に普及している。

マイクロソフトやメタ、グーグルといったビッグテックだけでなく、米国防総省も2021年から軍の情報システムを対象に開始するなど、安定したシステム運営やセキュリティ保障にとって欠かせない存在になりつつある。

企業や団体にとって、自分たちでは発見できなかったバグに対応できるというメリットがあるだけでなく、参加者の側にも、報奨金の獲得と自身の腕試しができるという魅力があることが普及を後押ししている。

Googleなどビッグテックはバグバウンティに高額オファー

有名IT企業も次々とバグバウンティプログラムを取り入れている(UnsplashBrett Jordanより   )

グーグルのバグバウンティを例に挙げると、Chromeの脆弱性など報告された問題に対して、1件あたり約500ドル~1万5,000ドルを支払うとしている。

2019年のバグバウンティプログラムの支払合計額は650万ドルだったが、特に重要な報告については1件あたりの上限を大きく上回る金額を支払っており、最高額は20万1337ドルだったともいわれている。

一方、アップルはさらに高額なオファーをすることを発表しており、iPhoneにこれまでで最も手厚いセキュリティを提供する「Lockdown Mode」に関連したバグの発見には、最高200万ドルを支払うことを明らかにした。

人気のAIチャットボット「ChatGPT」でもバグは問題に

今年に入って、バグバウンティの導入で話題となった「ChatGPT」は、高性能AIによって自然な会話ができるAIチャットボットだ。

まるで人間のような文章作成が話題の「ChatGPT」(UnsplashJonathan Kemperより)

米国のOpenAI社によって開発されたこのサービスは、2022年11月に公開されてからというものの、無料かつ簡単に利用できる高性能なAIボットサービスとして瞬く間に注目を集め、公開からたった2ヶ月で月間ユーザー数が1億人を突破。今年に入ってからは、米マイクロソフトが100億ドルを投資するという報道もあり、さらなるサービスの拡大と成長が期待されている。

日本でも、広告の作成やマニュアル作成、問い合わせへの対応などに活用されつつあるようだ。

これまでChatGPTで問題となってきたバグ

このように世界中で人気のChatGPTだが、かねてより様々なバグに悩まされている。

先月には、ユーザーが自分のものではないとするチャット履歴の画像を、ソーシャルメディアのRedditとTwitterで共有。対応するため、システム全体が一時停止となった。

開発元であるOpenAI社のサム・アルトマンCEOは、重大な問題については修正済みだと弁明したものの、ユーザーの間で広がったプライバシーに関する不安は今も消えていない。

その数日後、あるTwitterユーザーが、ChatGPTをハッキングして80以上の秘密のプラグインを発見したと投稿しており、同社はChatGPTの脆弱性への対応を強く迫られている状況だ。

バグバウンティ導入を試みるOpenAI社

このような問題への対応策を講じる上で、同社は、システムの脆弱性を特定し対処するためには「透明性と協力が不可欠」であるとして、「セキュリティ研究者、ホワイトハッカー、テクノロジーに強い熱意を持つ人々からなるグローバルなコミュニティに協力を呼びかける」とアナウンスし、バグバウンティプログラムを導入した。

同社のAIシステム内のセキュリティ上の欠陥、脆弱性といった問題を報告した人に提供される報酬は賞金形式で、「重大性の低い発見」は200ドルから、より重要な「例外的な発見」は2万ドルのオファーとなっている。

 OpenAI社はバグの発見に200ドルから20000ドルの賞金をオファー(UnsplashLevart_Photographerより)

提携するバグバウンティプラットフォームは、サンフランシスコに拠点を置き、これまでテスラやマスターカードとの実績もある 「Bugcrowd」だ 。

バグバウンティには報奨金の対象外ケースも

今回、ChatGPTに質問や指示の仕方を工夫することで、本来は安全フィルタによってブロックされるような回答を引き出す「ジェイルブレイク(脱獄とも呼ばれる)」や、悪意のあるコードやテキストを生成させる方法の発見に関しては、報奨金の対象外となっている。

ヘイトスピーチや詐欺メールの文章生成、爆発物などの作り方、コンピューターウイルスのコードなど、社会に害をなす創作物は、ChatGPTで作成できないよう制限がかけられているが、これを巧妙に回避するためにChatGPTと会話を始める前段階として一番最初に入力するテキスト「プロンプト」が、これまでにいくつか発見されている。

しかし、今回のバグバウンティにおいては、そのようなケースは「バグ」ではないため対象には含めないとのことだ。

バグバウンティはChatGPTの抱える問題を解決できるか?

前述のバグ事件に起因したセキュリティ上の不安は、日本の企業にも広がっており、社内利用の禁止や細かい使用ルール作りを進める企業も出てきている。  

バグバウンティはChatGPTの問題点を解決に導けるか(UnsplashLevart_Photographerより)

ChatGPT自体の注目度が元々高いこともあり、このたび発表されたバグバウンティプログラムが、このような脆弱性の解決にどれだけ寄与できるのかにも、高い関心が向けられている。

同社のバグバウンティでは対象外とされている「脱獄」についても、予備知識を持たない者でも犯罪の準備が容易になるとの懸念が示されており、今後、何らかの対策が求められることになるだろう。

文:大津陽子
編集:岡徳之(Livit