Wszyscy skupiają się na tym, kto zaprezentuje najbardziej efektowny humanoidalny demo. Jim Fan właśnie powiedział ci o rzeczywistej rywalizacji: kto potrafi wygenerować wystarczającą ilość syntetycznych danych fizycznych, aby zamknąć 100 000-letnią lukę. Ta liczba nie jest przesadą. Ken Goldberg z Berkeley obliczył, że dane tekstowe używane do trenowania LLM-ów zajęłyby człowiekowi 100 000 lat do przeczytania. Roboty mają dostęp do prawie żadnych z tych równoważnych danych dotyczących manipulacji fizycznej. Każde chwytanie, każdy potknięcie, każda zmiana wagi musi być nauczona od podstaw lub symulowana. Dlatego laboratorium Fana wypuszcza trzy wersje modelu w ciągu dziewięciu miesięcy (N1 w marcu, N1.5 w czerwcu, N1.6 w grudniu), podczas gdy większość firm zajmujących się robotyką wciąż zbiera rzeczywiste demonstracje. NVIDIA nie konkuruje tylko na poziomie sprzętu. Konkurują na swojej zdolności do generowania nieograniczonych syntetycznych danych treningowych za pośrednictwem Omniverse. Stos GR00T ujawnia strategię: GR00T Dreams generuje syntetyczne dane wideo. GR00T-Gen tworzy środowiska symulacyjne. GR00T-Mimic generuje trajektorie. Każdy komponent istnieje, aby wytwarzać dane fizyczne, które nie istnieją w internecie. Ramka „Fizycznego Testu Turinga” Fana jest precyzyjna. Zbudujemy systemy, które potrafią rozumować o białkach i udowadniać twierdzenia, zanim zbudujemy systemy, które potrafią niezawodnie składać pranie. Fizyczna Inteligencja właśnie to udowodniła w zeszłym tygodniu, gdy zmierzyli się z zadaniami wyzwania „Robotyczne Igrzyska Olimpijskie” Benjie Holsona. Ich model zdobył złote medale w 3 z 5 kategorii. Ale zauważ, czego nie mogli rozwiązać: zadania wymagające użycia narzędzi o specyficznych właściwościach fizycznych. Granicą nie jest rozumowanie. To dynamika kontaktu. OpenAI i Anthropic skalują, przeszukując internet. Fizyczna AI nie ma internetu do przeszukiwania. Zespół, który wygra, to ten, który wymyśli, jak wyprodukować 100 milionów godzin doświadczenia fizycznego w symulacji i przenieść to do rzeczywistego świata. NVIDIA ze swoim DNA graficznym, infrastrukturą symulacyjną i 30-osobowym zespołem systematycznie udostępniającym modele bazowe może być lepiej przygotowana niż ktokolwiek inny, aby dokładnie to zrobić.