Je suis en mission singulière pour résoudre le Test de Turing Physique pour la robotique. C'est le prochain, ou peut-être LE dernier grand défi de l'IA. La super-intelligence dans les chaînes de texte remportera un prix Nobel avant que nous n'ayons l'intelligence des chimpanzés en agilité et dextérité. Le paradoxe de Moravec est une malédiction à briser, un mur à abattre. Rien ne peut se mettre entre l'humanité et une productivité physique exponentielle sur cette planète, et peut-être un jour sur des planètes au-delà. Nous avons commencé un petit laboratoire chez NVIDIA et avons récemment atteint 30 personnes. L'équipe dépasse largement ses capacités. Notre empreinte de recherche couvre les modèles fondamentaux, les modèles du monde, le raisonnement incarné, la simulation, le contrôle corporel complet, et de nombreuses variantes de RL - en gros, l'ensemble de la pile d'apprentissage des robots. Cette année, nous avons lancé : - GR00T VLA (modèles fondamentaux vision-langage-action) : N1 open-source en mars, N1.5 en juin, et N1.6 ce mois-ci ; - GR00T Dreams : modèle du monde vidéo pour l'échelle des données synthétiques ; - SONIC : modèle fondamental de contrôle corporel humanoïde ; - Post-formation RL pour les VLA et recettes RL pour sim2real. Ces réalisations n'auraient pas été possibles sans les nombreuses équipes collaboratrices chez NVIDIA, un soutien fort de la direction, et des co-auteurs des laboratoires universitaires. Merci à tous de croire en la mission. Fil sur la galerie des jalons :