NVIDIAがロボット向け"万能AI"「Cosmos 3」を無償公開 — 物理世界を理解するAIとは何か


NVIDIA Cosmos 3 — フィジカルAIの仕組み 入力 テキスト・画像 動画・音声 センサーデータ Cosmos 3 オムニモデル 物理世界を学習 20兆トークンで訓練 活用先 🤖 ロボット 動作・把持の訓練 🚗 自動運転 物理予測・判断 オープンソース公開 モデル重み・学習データ すべて無償公開 訓練期間の短縮 仮想空間でシミュレーション 数ヶ月 → 数日 Edge版(近日公開) クラウド不要 リアルタイム推論 NVIDIAはGPU販売のためCosmos 3を無償提供
Cosmos 3は多様な入力を統合し、ロボット・自動運転の物理的判断を支援する
ひよこ ひよこ
ペンギン先生、NVIDIAが「Cosmos 3」っていうAIを無料で公開したって聞いたんだけど、何なの?
ペンギン先生 ペンギン先生
Computex 2026で発表された「フィジカルAI」の基盤モデルだよ。ロボット自動運転車が物理的な世界を理解して動くための、AIの"土台"なんだ
ひよこ ひよこ
ChatGPTとかとは違うの?
ペンギン先生 ペンギン先生
大きく違うよ。ChatGPTは「言葉の世界」で動くAIだけど、Cosmos 3は「物理の世界」──重力・衝突・距離感・物の重さ──を理解するように20兆ものデータで学習されているんだ
ひよこ ひよこ
テキスト・画像・動画・音・行動を全部1つのAIで扱えるって書いてあったけど、どういうこと?
ペンギン先生 ペンギン先生
オムニモデル」と呼ばれるタイプで、複数の感覚を統合して判断できるんだよ。ロボットが「この物体は何センチ先にある?つかんだら落とさない力加減は?」と判断するには視覚・距離感・動き全部が同時に必要だよね。それをひとつのモデルでやれるんだ
ひよこ ひよこ
ロボットの訓練に使えるってどういうこと?実際にロボットを動かさなくていいの?
ペンギン先生 ペンギン先生
そこがポイントなんだ!ロボットを実機で訓練するのは時間もコストも莫大にかかるんだよ。Cosmos 3を使うと仮想の物理空間でシミュレーションして訓練できるから、これまで数ヶ月かかっていた訓練が数日に短縮できるんだ
ひよこ ひよこ
自動運転にも使われるの?
ペンギン先生 ペンギン先生
そうだよ。「前の車が急ブレーキをかけそうか」「雨で濡れた路面でどう曲がるか」みたいな判断は、物理世界を正確に予測できないとできない。Cosmos 3はこういった「次に何が起きるか」を予測するワールドモデルとしても機能するんだ
ひよこ ひよこ
なんでNVIDIAは無料で公開するの?モデルの重みまで全部公開するって太っ腹だよね
ペンギン先生 ペンギン先生
NVIDIAの本業はGPUを売ること。Cosmos 3が世界中のロボット・自動運転の研究者に使われるほど、「訓練にはNVIDIAGPUが必要」という需要が増えるんだよ。モデルを無料で配ってGPUを買ってもらう——それがNVIDIAの戦略なんだ
ひよこ ひよこ
もうすぐ「Cosmos 3 Edge」っていうのも出るって書いてあったんだけど?
ペンギン先生 ペンギン先生
ロボットや車に直接組み込んで、クラウドに頼らずリアルタイムで動く軽量版だよ。デジタルの世界で賢くなったAIが、いよいよ体を持って物理の世界に出てくる——フィジカルAIの時代がここから本格的に始まるんだね