熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
每個人都專注於誰能展示最炫目的類人機演示。吉姆·范剛告訴你實際的競賽:誰能生成足夠的合成物理數據來填補10萬年的空白。
這個數字並不是誇張。肯·戈德堡在伯克利計算出,用於訓練大型語言模型的文本數據,讓人類閱讀需要10萬年。機器人幾乎無法獲得任何相當於物理操作的數據。每一次抓取、每一次絆倒、每一次重心轉移都需要從頭學習或模擬。
這就是為什麼范的實驗室在九個月內推出三個模型版本(N1在三月,N1.5在六月,N1.6在十二月),而大多數機器人公司仍在收集現實世界的演示。NVIDIA並不僅僅在硬體上競爭。他們在於通過Omniverse生成無限的合成訓練數據的能力上競爭。
GR00T堆疊揭示了這一策略:GR00T Dreams生成合成視頻數據。GR00T-Gen創建模擬環境。GR00T-Mimic生成軌跡。每個組件的存在都是為了製造互聯網上不存在的物理數據。
范的“物理圖靈測試”框架非常精確。我們將構建能夠推理蛋白質並證明定理的系統,然後再構建能夠可靠摺疊衣物的系統。物理智能上週剛剛展示了這一點,當他們應對本吉·霍爾森的“機器人奧林匹克”挑戰任務時。他們的模型在五個類別中獲得了三枚金牌。但注意他們無法解決的問題:需要使用具有特定物理屬性的工具的任務。前沿不在於推理,而在於接觸動力學。
OpenAI和Anthropic通過抓取互聯網來擴展。物理AI沒有互聯網可供抓取。贏得比賽的團隊是那些能夠在模擬中製造1億小時物理經驗並將其轉移到現實世界的團隊。
NVIDIA憑藉其圖形DNA、模擬基礎設施和30人的團隊,系統性地開源基礎模型,可能比任何人都更有可能做到這一點。
熱門
排行
收藏
