AMP

AMP CLOSE×

Google、次世代AIモデル「Gemini」を発表 「Pixel 8 Pro」などGoogle各製品に導入

Googleは、次世代AIモデル「Gemini」を発表した。マルチモーダルとしてゼロから構築されたGeminiは、テキスト、画像、音声、動画など、さまざまな種類の情報を一般化してシームレスに理解し、操作し、組み合わせることができる。

Google、次世代AIモデル「Gemini」を発表

Geminiは、Google Researchのメンバーを含むGoogle全体での大規模な共同研究の成果であり、Geminiの最初のバージョンであるGemini 1.0は、3つのサイズで提供される。

・Gemini Ultra:非常に複雑なタスクに対応する、高性能かつ最大のモデル
・Gemini Pro:幅広いタスクに対応する最良のモデル
・Gemini Nano:デバイス上のタスクに最も効率的なモデル

Geminiのパフォーマンスは、既存のマルチモーダルモデルよりもはるかに優れており、ほぼすべてのドメインで最高水準であるという。

・自然な画像の理解から数学的推論、音声や動画の理解に至るまで、広く使用されている32の業界ベンチマークのうち30で、Gemini Ultraのパフォーマンスは既存の最高水準の結果を上回っている。

・Gemini Ultraは、数学、物理学、歴史、法律、医学、倫理など57の科目の組み合わせて知識と問題解決能力をテストするMMLUで90.00%をスコアし、人間の専門家を上回るパフォーマンスを示した初のモデル。

・Gemini Ultraは、意図的な推論を必要とする異なるドメインにまたがるマルチモーダルタスクで構成される新しいMMMUベンチマークでも、59.4%という最高水準のスコアを達成した。

Geminiは、テキスト、画像、音声などを同時に認識して理解できるようにトレーニングされているため、ニュアンスを含んだ情報をより理解し、複雑なトピックに関する質問に答えることができる。特に数学や物理学の推論の説明に優れているという。

また、Python、Java、C++、Go など、世界で最も広く利用されているプログラミング言語の理解、説明、そして高品質なコードを生成可能。

Geminiは、Googleの各製品を通じて数十億人のユーザーに提供されるとのことだ。

・Bard:理解と要約、推論、ブレインストーミング、文章編集、計画の立案など、Bardでできることが大幅に向上する。
・Google Pixel 8 Pro:Gemini Nanoを搭載し、レコーダーアプリの要約などの新機能が強化される。
・Google Search、広告、Chrome、Duet AI:今後数か月間かけて、Geminiが利用可能になる。

なお、Gemini Ultraは、信頼できる外部関係者によるレッドチームを含む広範な信頼性および安全性チェックを実施するとともに、展開前のファインチューンと人間のフィードバックによる強化学習(RLHF)によってモデルのさらなる改良を行っているという。

来年の開発者や企業への公開前に、初期実験とフィードバックを目的とし、一部の顧客、開発者、パートナー、安全責任専門家に提供するとのことだ。

Googleは、Geminiの開発を継続し、責任を持ってモデルを進化させていくとしている。

Vote

  • SDGsへの興味・関心はありますか?
  • SDGsの17の項目のうち、企業に特に取り組んでもらいたいのはどの項目ですか?(複数回答可)
  • SDGsに寄与している企業を評価しますか?
  • SDGsに寄与している企業の製品・サービスの利用について教えてください
  • 製品そのものがサステナブルなのかどうかは購買意思決定の基準になりますか?
  • ESG(環境・社会・ガバナンス)を意識した経営・取り組みを行っている企業に関心はありますか?
  • SDGs6「安全な水とトイレを世界中に」において、日本が抱える1番の問題はなん だと思いますか?
  • SDGs6「安全な水とトイレを世界中に」において、ご自身が取り組んでいることは以下のうちどれですか?(複数回答可)
  • SDGs6の達成のために、これからも意識して行動しようと考えていますか?