トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIA ロボット工学ディレクター兼著名な科学者。GEARラボ共同リーダー。物理AGIを一度に1つのモーターで解きます。スタンフォード大学博士 OpenAIの1人目のインターン。
私はロボティクスの物理チューリングテストを解くという唯一のミッションに取り組んでいます。これはAIの次なる、あるいは最後の大きな挑戦かもしれません。チンパンジーのような敏捷性や器用さが現れる前に、テキスト文字列の超知能がノーベル賞を獲るでしょう。モラヴェックのパラドックスは、壊すべき呪いであり、壊すべき壁だ。人類とこの惑星、そしていつかはその先の惑星で指数関数的な物理的生産性を阻むものは何もありません。
NVIDIAで小さなラボを始め、最近30人に成長しました。チームはその実力以上のパンチを発揮しています。私たちの研究範囲は基礎モデル、世界モデル、身体的推論、シミュレーション、全身制御、そして多くの強化学習(RL)の形態に及び、基本的にはロボット学習のフルスタックです。
今年は以下の項目を発表しました:
- GR00T VLA(ビジョン・言語・行動)基盤モデル:3月にオープンソース化されたN1、6月にN1.5、今月N1.6;
- GR00T Dreams:合成データのスケーリングのためのビデオワールドモデル;
- SONIC:ヒューマノイド全身制御基礎モデル;
- VLAのRLポストトレーニングおよびsim2realのRLレシピ。
これらはNVIDIAの多くの協力チーム、強力なリーダーシップの支援、そして大学の研究室からの共著者なしには実現しなかったでしょう。ミッションを信じてくださった皆さん、ありがとうございます。
マイルストーンギャラリーのスレッド:

125
私の博士課程時代、Atari 2600はAIエージェントの黄金の基準でした。50+アタリのゲームを再生できる単一のニューラルネットは、驚異的とされるでしょう。モデルたちは84x84のグレースケールピクセル画面をいくつかのボタンにマッピングするのに苦労しました。
その後、OpenAI Five(Dota)とDeepMindのAlphaStarが勢いを増し、eスポーツで世界のトップチャンピオンを打ち負かしました。しかし、一度に単一の仮想環境に過度適合します。何かを変えるとモデルが即座に壊れてしまいます。
人間は全く異なる物理法則やルールに適応するのが非常に優れており、これは私たちの最先端の兆単位規模の大型大型言語模型(LLM)でも今なお手に入らないことです。1000本のゲームを1000のシミュレーションだと考えてください。エージェントがより多くの仮想世界に適応できるほど、身体化された推論、知覚、運動協調がより発達します。これらはすべてロボット工学の大きなパズルの重要なピースです。
NitroGenモデルとGym APIをオープンソース化することで、AlphaGo、AlphaStar、OpenAI Five、そして最近のGoogle SIMAと同じ目標を果たしています。つまり、これらのゲームの楽しさを奪うのではなく、現代AIの限界を浮き彫りにし、確かな基準を提供し、進捗を測るための新たなベンチマーク「Atari 2.0」を作ることです。

Jim Fan12月20日 01:15
NitroGenをご紹介します。これはオープンソースの基盤モデルで、RPG、プラットフォーマー、バトルロイヤル、レース、2D、3Dなど、1000+のゲームをプレイできるように訓練されています!私たちは、現実世界の物理学だけでなく、マルチバースのシミュレーション全体にまたがるあらゆる物理を極める汎用具身エージェントの探求に出ています。
元々ロボット向けに設計されたGR00T N1.5アーキテクチャは、まったく異なるメカニクスを持つ多くのゲームに容易に適応できることを発見しました。私たちのレシピはシンプルで苦い教訓をもらったものです:(1) 4万+時間の高品質な公開された野外ゲームプレイのデータセット;(2) 連続運動制御のための高度な基礎モデル;(3) 任意のゲームバイナリをラップしてロールアウトを実行するGym APIです。
私たちのデータキュレーションは非常に楽しいです。ゲーマーはリアルタイムのゲームパッド操作をビデオストリームに重ねて自分のスキルを披露するのが大好きです。そこで、私たちはセグメンテーションモデルを訓練し、それらのゲームパッドディスプレイを検出・抽出し、それを専門家のアクションに変換します。その後、モデルがショートカットを悪用しないようにその領域をマスキングします。訓練中、GR00T N1.5のバリアントは4万時間のピクセルから拡散トランスを介して動作にマッピングすることを学習します。
窒素は始まりに過ぎず、その能力をさらに大きく伸ばす道のりは長いです。私たちは意図的にシステム1の側面、すなわち高速な運動操作の「ゲーマー本能」に注目しています。私たちは、事前学習済みのモデル重み、アクションデータセット全体、コード、そしてしっかりした詳細を含むホワイトペーパーなど、あらゆるものをオープンソース化しています。
今日、ロボティクスは難しいAI問題の集合体です。
明日には、それは身体化されたAGIのはるかに大きな潜在空間の中の一つの点、サブセットになるかもしれません。
その後、プロンプトを出してロボットコントローラーを「リクエスト」するだけです。
それが最終目的かもしれません(言葉遊びです)。
NitroGenは、ロイック・マグネ、アナス・アワダラ、グアンジー・ワンという優秀な頭脳が共同で率いています。これは複数機関の協力です。下記のGuanzhiの技術的な詳細なスレッドとリポジトリリンクをチェックしてください!
483
NitroGenをご紹介します。これはオープンソースの基盤モデルで、RPG、プラットフォーマー、バトルロイヤル、レース、2D、3Dなど、1000+のゲームをプレイできるように訓練されています!私たちは、現実世界の物理学だけでなく、マルチバースのシミュレーション全体にまたがるあらゆる物理を極める汎用具身エージェントの探求に出ています。
元々ロボット向けに設計されたGR00T N1.5アーキテクチャは、まったく異なるメカニクスを持つ多くのゲームに容易に適応できることを発見しました。私たちのレシピはシンプルで苦い教訓をもらったものです:(1) 4万+時間の高品質な公開された野外ゲームプレイのデータセット;(2) 連続運動制御のための高度な基礎モデル;(3) 任意のゲームバイナリをラップしてロールアウトを実行するGym APIです。
私たちのデータキュレーションは非常に楽しいです。ゲーマーはリアルタイムのゲームパッド操作をビデオストリームに重ねて自分のスキルを披露するのが大好きです。そこで、私たちはセグメンテーションモデルを訓練し、それらのゲームパッドディスプレイを検出・抽出し、それを専門家のアクションに変換します。その後、モデルがショートカットを悪用しないようにその領域をマスキングします。訓練中、GR00T N1.5のバリアントは4万時間のピクセルから拡散トランスを介して動作にマッピングすることを学習します。
窒素は始まりに過ぎず、その能力をさらに大きく伸ばす道のりは長いです。私たちは意図的にシステム1の側面、すなわち高速な運動操作の「ゲーマー本能」に注目しています。私たちは、事前学習済みのモデル重み、アクションデータセット全体、コード、そしてしっかりした詳細を含むホワイトペーパーなど、あらゆるものをオープンソース化しています。
今日、ロボティクスは難しいAI問題の集合体です。
明日には、それは身体化されたAGIのはるかに大きな潜在空間の中の一つの点、サブセットになるかもしれません。
その後、プロンプトを出してロボットコントローラーを「リクエスト」するだけです。
それが最終目的かもしれません(言葉遊びです)。
NitroGenは、ロイック・マグネ、アナス・アワダラ、グアンジー・ワンという優秀な頭脳が共同で率いています。これは複数機関の協力です。下記のGuanzhiの技術的な詳細なスレッドとリポジトリリンクをチェックしてください!
440
トップ
ランキング
お気に入り