トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
私の博士課程時代、Atari 2600はAIエージェントの黄金の基準でした。50+アタリのゲームを再生できる単一のニューラルネットは、驚異的とされるでしょう。モデルたちは84x84のグレースケールピクセル画面をいくつかのボタンにマッピングするのに苦労しました。
その後、OpenAI Five(Dota)とDeepMindのAlphaStarが勢いを増し、eスポーツで世界のトップチャンピオンを打ち負かしました。しかし、一度に単一の仮想環境に過度適合します。何かを変えるとモデルが即座に壊れてしまいます。
人間は全く異なる物理法則やルールに適応するのが非常に優れており、これは私たちの最先端の兆単位規模の大型大型言語模型(LLM)でも今なお手に入らないことです。1000本のゲームを1000のシミュレーションだと考えてください。エージェントがより多くの仮想世界に適応できるほど、身体化された推論、知覚、運動協調がより発達します。これらはすべてロボット工学の大きなパズルの重要なピースです。
NitroGenモデルとGym APIをオープンソース化することで、AlphaGo、AlphaStar、OpenAI Five、そして最近のGoogle SIMAと同じ目標を果たしています。つまり、これらのゲームの楽しさを奪うのではなく、現代AIの限界を浮き彫りにし、確かな基準を提供し、進捗を測るための新たなベンチマーク「Atari 2.0」を作ることです。
トップ
ランキング
お気に入り
