*Lansarea majoră* a AI open source astăzi. Poate America să câștige cursa Open AI? Conversația mea cu @natolambert și @soldni de @allen_ai despre lansarea Olmo 3 00:00 – Deschidere la rece 00:39 – Bun venit și marele anunț de astăzi 01:18 – Prezentăm familia de modele Olmo 3 02:07 – Ce sunt cu adevărat "modelele de bază" (și de ce contează) 05:51 – Dolma 3: datele din spatele lui Olmo 3 08:06 – Performance vs Qwen, Gemma, DeepSeek 10:28 – Ce înseamnă adevăratul open source (și de ce este rar) 12:51 – Puncte de control intermediare, transparență și de ce AI2 publică totul 16:37 – De ce Qwen este peste tot (inclusiv în startup-urile din SUA) 18:31 – De ce laboratoarele chineze devin open source (și de ce laboratoarele din SUA nu) 20:28 – În interiorul ATOM: răspunsul SUA la creșterea modelului Chinei 22:13 – Ascensiunea "modelelor de gândire" și scalarea inferenței-timp 35:58 – Întreaga conductă Olmo, explicată simplu 46:52 – Pre-antrenament: date, scară și evitarea creșterilor catastrofale 50:27 – Antrenament la mijlocul antrenamentului (patching al cozii) și evitarea scurgerilor la test 52:06 – De ce contează antrenamentul pe termen lung 55:28 – SFT: construirea fundației raționamentului 1:04:53 – Acordajul preferințelor și de ce DPO încă funcționează 1:10:51 – Partea dificilă: RLVR, lanțuri lungi de raționament și probleme de infrastructură 1:13:59 – De ce RL este atât de brutal din punct de vedere tehnic 1:18:17 – Taxa de complexitate vs hype-ul AGI 1:21:58 – Cum poate contribui toată lumea la viitorul AI 1:27:26 – Gânduri finale
... cursa cu AI open **source**, d'oh 🤦 ♂️
329