Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIAn robotiikan johtaja ja arvostettu tutkija. GEAR-laboratorion toinen johtaja. Fyysisen AGI:n ratkaiseminen, yksi moottori kerrallaan. Stanford Ph.D. OpenAI:n 1. harjoittelija.
Minulla on yksittäinen tehtävä ratkaista fyysinen Turing-testi robotiikalle. Se on seuraava, tai ehkä VIIMEINEN suuri haaste tekoälylle. Superälykkyys tekstimerkkijonoissa voittaa Nobelin palkinnon ennen kuin meillä on simpanssiäly ketteryydessä ja ketteryydessä. Moravecin paradoksi on kirous, joka täytyy murtaa, muuri, joka täytyy purkaa. Mikään ei voi estää ihmiskuntaa eksponentiaalisesta fyysisestä tuottavuudesta tällä planeetalla, ja ehkä jonain päivänä myös planeetoilla sen ulkopuolella.
Perustimme pienen laboratorion NVIDIAlle ja kasvoimme hyvin hiljattain 30 työntekijään. Joukkue lyö paljon enemmän kuin sen paino. Tutkimusjalanjälkemme kattaa perustamallit, maailmanmallit, ruumiillistuneen päättelyn, simulaation, koko kehon hallinnan ja monia RL:n muotoja – käytännössä koko robottioppimisen pinoa.
Tänä vuonna lanseerasimme:
- GR00T VLA (vision-language-action) perusmallit: avoimen lähdekoodin N1 maaliskuussa, N1.5 kesäkuussa ja N1.6 tässä kuussa;
- GR00T Dreams: videomaailman malli synteettisen datan skaalaamiseen;
- SONIC: humanoidinen koko kehon kontrollin perustamalli;
- RL-jälkikoulutus VLA:ille ja RL-resepteille sim2realille.
Nämä eivät olisi olleet mahdollisia ilman NVIDIA:n lukuisia yhteistyötiimejä, vahvaa johtotukea ja yliopistolaboratorioiden yhteiskirjoittajia. Kiitos kaikille, että uskotte tehtävään.
Ketju virstanpylväiden galleriasta:

124
Atari 2600 oli aiemmin tekoälyagenttien kultainen vertailukohta väitöskirjani aikana. Yksi hermoverkko, joka pystyy pelaamaan 50+ Atari-peliä, olisi uskomaton. Mallit kamppailivat 84x84 harmaasävyisen pikselinäytön kartoittamisessa muutamaan nappiin.
Sitten OpenAI Five (Dota) ja DeepMindin AlphaStar nostivat tasoa, päihittäen maailman parhaat mestarit Esportsissa. Silti ne sopivat yhteen virtuaaliympäristöön kerrallaan. Minkä tahansakin muuttaminen rikkoisi mallin välittömästi.
Ihmiset ovat poikkeuksellisen hyviä sopeutumaan hyvin erilaisiin fysiikoihin ja sääntöihin – asia, joka yhä jää saavuttamatta kaikkein edistyneimmiltä, biljoonan mittakaavan LLM-malleiltamme. Ajattele 1000 peliä kuin 1000 simulaatiota. Mitä enemmän virtuaalimaailmoihin agentti pystyy sopeutumaan, sitä paremmin se kehittää ruumiillista päättelyä, havaintoa ja motorista koordinaatiota. Kaikki kriittisiä osia robotiikan suuressa palapelissä.
Avoimen lähdekoodin NitroGen-mallin ja Gym API:n avulla palvelemme samaa tavoitetta kuin AlphaGo, AlphaStar, OpenAI Five ja äskettäin Google SIMA: emme vie pois näiden pelien hauskuutta, vaan korostaa modernin tekoälyn rajoituksia, tarjota vankka lähtökohta ja luoda uusi vertailukohta – "Atari 2.0" – edistymisen mittaamiseksi.

Jim Fan20.12. klo 01.15
Esittelyssä NitroGen, avoimen lähdekoodin perustamalli, joka on koulutettu pelaamaan 1000+ peliä: roolipeli, tasohyppely, battle royale, kilpa-ajo, 2D, 3D, mitä tahansa! Olemme etsimässä yleiskäyttöisiä ruumiillistuneita agentteja, jotka hallitsevat paitsi todellisen fysiikan, myös kaiken mahdollisen fysiikan multiversumin simulaatioissa.
Huomasimme, että GR00T N1.5 -arkkitehtuurimme, joka alun perin suunniteltiin robotiikkaan, voidaan helposti mukauttaa pelaamaan monia pelejä, joissa on täysin erilaiset mekaniikat. Reseptimme on yksinkertainen ja katkera opetus: (1) 40K+ tunnin korkealaatuinen tietoaineisto julkisesta luonnossa pelattavuudesta; (2) erittäin pätevä pohjamalli jatkuvaan motoriseen ohjaukseen; (3) Gym-API, joka käärii minkä tahansa pelin binäärin käynnistääkseen julkaisut.
Datan kuratointi on todella hauskaa: pelaajat rakastavat esitellä taitojaan lisäämällä reaaliaikaisen peliohjaimen ohjauksen videolähetykseen. Koulutamme segmentointimallin havaitsemaan ja poimimaan nämä peliohjaimen näytöt ja muuttamaan ne asiantuntijatoimiksi. Sitten peitämme kyseisen alueen estääksemme mallia hyödyntämästä oikotietä. Koulutuksen aikana GR00T N1.5:n muunnelma oppii kartoittamaan 40 000 tunnin pikseleistä toimintoihin diffuusiomuuntajien avulla.
NitroGen on vasta alkua, ja siihen on vielä pitkä matka mäkien nousuun. Keskitymme tarkoituksella vain System 1:n puoleen: nopeaan motoriseen ohjaukseen "pelaajan vaistoon". Tarjoamme avoimen lähdekoodin *kaiken* sinulle muokkattavaksi: esikoulutetut mallipainot, koko toimintaaineisto, koodi ja valkoinen kirja, jossa on tarkat yksityiskohdat.
Nykyään robotiikka on kovien tekoälyongelmien yläosa.
Huomenna siitä voi tulla osajoukko, piste paljon suuremmassa ruumiillistuneen AGI:n latenttitilassa.
Sitten vain kehotat ja "pyydät" robottiohjainta.
Se saattaa olla loppupeli (sanaleikki tarkoituksella).
NitroGeniä johtavat yhdessä loistavat mielemme: Loic Magne, Anas Awadalla, Guanzhi Wang. Se on moniinstitutionaalinen yhteistyö. Katso alla Guanzhin tekninen syväsukellusketju ja takavarikolinkit!
482
Esittelyssä NitroGen, avoimen lähdekoodin perustamalli, joka on koulutettu pelaamaan 1000+ peliä: roolipeli, tasohyppely, battle royale, kilpa-ajo, 2D, 3D, mitä tahansa! Olemme etsimässä yleiskäyttöisiä ruumiillistuneita agentteja, jotka hallitsevat paitsi todellisen fysiikan, myös kaiken mahdollisen fysiikan multiversumin simulaatioissa.
Huomasimme, että GR00T N1.5 -arkkitehtuurimme, joka alun perin suunniteltiin robotiikkaan, voidaan helposti mukauttaa pelaamaan monia pelejä, joissa on täysin erilaiset mekaniikat. Reseptimme on yksinkertainen ja katkera opetus: (1) 40K+ tunnin korkealaatuinen tietoaineisto julkisesta luonnossa pelattavuudesta; (2) erittäin pätevä pohjamalli jatkuvaan motoriseen ohjaukseen; (3) Gym-API, joka käärii minkä tahansa pelin binäärin käynnistääkseen julkaisut.
Datan kuratointi on todella hauskaa: pelaajat rakastavat esitellä taitojaan lisäämällä reaaliaikaisen peliohjaimen ohjauksen videolähetykseen. Koulutamme segmentointimallin havaitsemaan ja poimimaan nämä peliohjaimen näytöt ja muuttamaan ne asiantuntijatoimiksi. Sitten peitämme kyseisen alueen estääksemme mallia hyödyntämästä oikotietä. Koulutuksen aikana GR00T N1.5:n muunnelma oppii kartoittamaan 40 000 tunnin pikseleistä toimintoihin diffuusiomuuntajien avulla.
NitroGen on vasta alkua, ja siihen on vielä pitkä matka mäkien nousuun. Keskitymme tarkoituksella vain System 1:n puoleen: nopeaan motoriseen ohjaukseen "pelaajan vaistoon". Tarjoamme avoimen lähdekoodin *kaiken* sinulle muokkattavaksi: esikoulutetut mallipainot, koko toimintaaineisto, koodi ja valkoinen kirja, jossa on tarkat yksityiskohdat.
Nykyään robotiikka on kovien tekoälyongelmien yläosa.
Huomenna siitä voi tulla osajoukko, piste paljon suuremmassa ruumiillistuneen AGI:n latenttitilassa.
Sitten vain kehotat ja "pyydät" robottiohjainta.
Se saattaa olla loppupeli (sanaleikki tarkoituksella).
NitroGeniä johtavat yhdessä loistavat mielemme: Loic Magne, Anas Awadalla, Guanzhi Wang. Se on moniinstitutionaalinen yhteistyö. Katso alla Guanzhin tekninen syväsukellusketju ja takavarikolinkit!
439
Johtavat
Rankkaus
Suosikit