NVIDIA、CVPR 2026でロボティクス・自動運転・仮想エージェント向けの新AIモデルを発表

NVIDIAは月曜日、シアトルで開催されたCVPR 2026カンファレンスにおいて、物理AIにとって重要な3分野（ロボットによる物体把持、自動運転、仮想エージェントのトレーニング）を対象とした新たなAIモデル群を発表した。同社によると、これらのモデルはスケーラビリティを考慮して設計されており、実験室から工場、道路、シミュレーション環境での現実的な展開へと移行できるという。

物理AIの3領域

これらのモデルは、ロボットや自動運転システムにおいて長年困難とされてきたタスクをカバーする。1つ目のモデルは物体の把持、つまりロボットアームが未知の物体を潰したり落としたりせずに掴む能力に焦点を当てている。2つ目は自動運転向けで、交通状況における知覚と意思決定を処理する。3つ目は仮想エージェントを対象としており、企業は現実環境に導入する前にシミュレーション世界で訓練を行う。

NVIDIAは詳細な性能ベンチマークを公開しなかったが、今回の発表は、同社がこれら3つの領域を物理AIの主要なボトルネックと見なしていることを示している。同社はロボティクス向けチップ、Isaac Simなどのシミュレーションプラットフォーム、車載コンピューティングシステムに多額の投資を行ってきた。これらのモデルは、そうしたハードウェアの取り組みをソフトウェア層に結びつけるものだ。

スケーリングの重要性

ロボットにペットボトルを掴むよう訓練することは一つの課題だ。しかし、形状、照明、角度に関わらず、倉庫が必要とする速度で任意のボトルを掴めるように教えることは別の課題である。同様に、デトロイトの降雪夜やムンバイの混乱した交差点に対応しなければならない自動運転車にも同じことが言える。NVIDIAの主張は、これらの新モデルはゼロから再トレーニングすることなく、そうしたバリエーションにわたってスケールできるというものだ。

仮想エージェントモデルは、デジタルツインを構築する企業やAIアシスタントを訓練する企業を対象としている。すべてのインタラクションをスクリプト化する代わりに、このモデルはエージェントがシミュレーション環境内で実際に行動することで学習できるようにする。このアプローチは物流やゲーム分野で普及しているが、NVIDIAはこれを製造業や医療にも展開したいと考えている。

ビジョンに焦点を当てたカンファレンス

CVPR（コンピュータビジョンとパターン認識に関する会議）は、コンピュータビジョン研究者にとって最大の年次集会である。NVIDIAが知覚と制御に関する研究を発表するのに適した場であり、同社はこのイベントに定期的に参加し、ハードウェアやオープンソースツールを発表してきた。今年は、見ることと行動することのギャップを埋めるモデルに重点が置かれた。

今回の発表では、モデルの具体的なリリース日やパイロット顧客については言及されなかった。NVIDIAは通常、AIモデルをデベロッパープラットフォームを通じて、あるいは研究者向けの事前学習済み重みとして提供している。これらの詳細は、今後のカンファレンスセッションが進むにつれて明らかになる可能性がある。

現時点での結論は明らかだ。NVIDIAは、AIの次の波はチャットボットや画像生成装置に限定されないと確信している。物理AI、つまり乱雑で予測不可能な物理世界と相互作用する機械こそが目標であり、同社は既に販売しているハードウェアの上に新しいモデルを積み重ねている。

物理AIの3領域

スケーリングの重要性

ビジョンに焦点を当てたカンファレンス

関連記事