AIロボットの市場規模は、2021年の70億ドルから、2026年には350億ドルと約5倍になる見込みだ。年平均成長率に換算すると毎年39%近い伸びとなる。(MarketsAndMarketsより)

そんなロボット市場で2024年上半期、大規模言語モデル(LLM)を活用したロボティクスアプリの開発プロジェクトが白熱している。LLMとマルチモーダルAI(テキストや画像、音声など複数種類のデータを組み合わせ処理できるAIモデル)によって、複雑なプロセスが要求されるタスクを遂行する能力の開発が大きく前進しているのだ。

AIとロボティクスの融合により、これまでのロボティクス産業にどのような変化が起きるのか、AI時代のロボット開発競争最前線に迫ってみたい。

イスラエル発MenteebotはAIファーストのヒューマノイドロボットを発表

イスラエルのスタートアップ企業Mentee Roboticsは、AIを全面的に活用したヒューマノイドロボット「Menteebot」のプロトタイプを発表。Menteebotは、OpenAIのChatGPTなどで普及したトランスフォーマーベースの大規模言語モデル(LLM)を全階層で使用している。

従来のロボットはその構造にAIを「活用する」スタンスだったが、Menteebotは構想初期から「AIファースト」の仕様で、複雑なタスクをエンドツーエンドで完了できるよう設計されている。最新のAIヒューマノイドロボットを体感すべく、具体的に見てみよう。

Menteebotが一つの指令に対し思考と行動を連鎖的におこなっていることがわかる

Menteeが公開した動画では「果物を箱に入れて、カウンターへ運んで」という1つの指令に対し、ロボットが以下の思考と行動を連鎖的に行う様子を見ることができる。

指令の内容を認識
→「了解です」と返答する
→「まず果物と箱を探し出す必要がある」と認識
→テーブルの上に2つの果物と箱があることと、その場所を認知
→2つの果物を黒い箱に入れると行動を規定
→アームを動かして果物を箱に移す作業を実行
→全ての果物が箱に入ったことを確認
→次は箱を持ち上げる必要があると認識
→箱を持ち上げる作業を実行
→自分が箱を持っていることを認識
→カウンターの場所と、そこまでのルートを探す必要があると認識
→カウンターの場所を特定し、箱を持ったまま移動
→カウンターに到着したことを認識
→箱をアームから降ろして棚に置く
→指令が完了したことを認識して止まる

全3階層のAIによりロボットが連鎖的に思考と行動を実行

Menteebotのオペレーションは3階層から構成され、その全てにAIが搭載されている。

まず第1階層は言語領域。トランスフォーマーベースのLLMを使って指令内容を解釈し、タスクを完了するために必要とされるステップを構築する。

第2階層は視覚領域で、NeRFベースのアルゴリズムを使い、周辺環境の3D認知マップをリアルタイムで作成。そこにはオブジェクトの意味情報も含まれる。そしてロボット自身がその地図のどこにいるかと認識し、障害物を避けて目的地まで行く道筋を策定する。

最後に策定されたステップに沿ってタスクを実行する。その際にはSim2Real(Simulator-to-reality)の機械学習により、シミュレーション環境下で規定された動きを、現実環境でのロボットの手と足の動きに落とし込んでいく。

このように、Menteebotは1段階ずつの指示を与えなくても、複雑な指令を自ら分解し、連鎖的に思考と行動を行い、タスクを完了することができる。これは家庭や工場などの環境下で稼働するヒューマノイドロボットとって、非常に重要かつ画期的なことだろう。

Menteebotは25年第一四半期にも最終版が完成する見通しだ。

Nvidiaは汎用基盤モデルProject GR00Tを発表

AIヒューマノイドロボットの最前線にいるのはMenteeだけではない。テスラやFigure、1X Technologiesなど他のプレイヤーたちも熾烈なスピードで開発を進めている。

Nvidiaは3月にマルチモーダルAIのProject GR00Tを発表。ヒューマノイドロボットが文字、音声、動画、さらにライブデモンストレーションをインプットとし、それを特定のアクションに結び付けてアウトプットすることを可能にする汎用基盤モデルだ。

NvidiaはProject GR00TをAgility Robotics, Apptronik, Boston Dynamics, Fourier Intelligence, Sanctuary AI, Unitree Robotics and XPENG Roboticsといったロボティクス業界の主要プレイヤーに供給。ヒューマノイドロボットのAI性能進化に大きな拍車がかかることは間違いないだろう。

Boston DynamicsはヒューマノイドロボットAtlasを全電動に完全リニューアル

Project GR00Tの供給先の一つBoston Dynamicsは、30年以上の歴史を持つ老舗ロボティクス企業だが、この4月に製品ラインナップの大幅刷新を発表。11年のキャリアを持つ油圧式のヒューマノイドロボットAtlasを完全廃止し、新たに全電動バージョンをローンチする。

Boston Dynamics社による旧Atlasへのフェアウェル動画。初代から現在に至るまでの進化と共に、宙返りに失敗したり階段で転んだりといったAtlasの姿が愛情たっぷりに収められている

油圧式に比べ、電動モーターは安価で軽量かつ静穏性に優れ、機動性も良い。また、油圧式と違って液漏れや修理の必要性も低いので、より実用的な商用展開に適しているのだ。Boston DynamicsのAtlasモデルチェンジは、現場においてヒューマノイドロボットが汎用段階に入ったという証拠かもしれない。

新しい電動Atlasは強度が上がり動きの幅も広がったため、幅広い業界での活躍が見込まれている。まずはBoston Dynamicsの親会社でもあるヒュンダイの自動車生産現場で稼働する予定だ。

ロボティクススタートアップの大規模資金調達も白熱

AI×ロボティクスへの関心の高まりにより、若きロボティクススタートアップ界隈の動きも活性化。この数か月で大規模な資金調達の発表が相次いでいる。

カリフォルニアのロボティクススタートアップFigureは2月に6億7,500万ドルの資金調達を発表。同時にOpenAIとのコラボレーションも発表し、新世代のAIモデルヒューマノイドロボットの商業開発を加速させるとした。

1XのヒューマノイドロボットEveがクッキーを作る様子

同じくOpenAIを後ろ盾に持つノルウェーのロボティクススタートアップ1X Technologiesも1月に1億ドルのシリーズBを発表。出資者リストにはサムソンをはじめとするビッグネームが並ぶ。

Cobotは確実性と低コスト重視の独自アプローチでロボット開発

元アマゾンのロボティクス担当VP、ブラッド・ポーター氏が2022年に創業したCobot (Collaborative Robotics)も4月に1億ドルのシリーズBを発表。

Cobotが開発中なのは独自の非ヒューマノイド型ロボット。業界が高性能で高価なヒューマノイドロボット開発にしのぎを削るのとは対照的に、確実性と低コストを重視したロボット開発を行い、RaaS(Robots-As-A-Service)モデルで運用すると明言している。

とはいえ、CobotもAI技術の取り込みを疎かにしているわけではない。開発中のロボットの詳細はまだ明らかにされていないが、既にLLMを使用した指令系統はできており、Nvidiaの複数のシステムも搭載されているとのこと。Cobotのような現実的なアプローチが、商業化においては他社の高度なロボットたちを凌駕する未来もあるかもしれない。

AIドリブンのロボティクス業界勢力図は混沌としていて、どこが圧倒的勝者となるか、大規模商業化で先行するかはまだ見えない。しかし、この数カ月でAIとロボットの融合が急加速したことは確かで、私たちは今、ロボティクス新時代の幕開けに立ち会っていることは間違いないだろう。

文:平島聡子
編集:岡徳之(Livit