*Merkittävä* avoimen lähdekoodin tekoälyjulkaisu tänään. Voiko Amerikka voittaa Open AI -kilpailun? Keskusteluni @natolambert:n ja @soldni @allen_ai:n kanssa Olmo 3:n julkaisusta 00:00 – Kylmä avaus 00:39 – Tervetuloa ja tämän päivän suuri ilmoitus 01:18 – Esittelyssä Olmo 3 -malliperhe 02:07 – Mitä "perusmallit" todella ovat (ja miksi ne ovat tärkeitä) 05:51 – Dolma 3: tiedot Olmo 3:n taustalla 08:06 – Suorituskyky vs Qwen, Gemma, DeepSeek 10:28 – Mitä todellinen avoin lähdekoodi tarkoittaa (ja miksi se on harvinaista) 12:51 – Välivaiheen tarkistuspisteet, läpinäkyvyys ja miksi AI2 julkaisee kaiken 16:37 – Miksi Qwen on kaikkialla (myös yhdysvaltalaisissa startupeissa) 18:31 – Miksi kiinalaiset laboratoriot siirtyvät avoimen lähdekoodin palvelukseen (ja miksi Yhdysvaltojen laboratoriot eivät) 20:28 – Inside ATOM: Yhdysvaltojen reaktio Kiinan mallien nousuun 22:13 – "Ajattelumallien" ja päättelyajan skaalauksen nousu 35:58 – Koko Olmo-putki, selitetty yksinkertaisesti 46:52 – Esikoulutus: data, mittakaava ja katastrofaalisten piikkien välttäminen 50:27 – Kesken koulutuksen (hännän paikkaus) ja testivuotojen välttäminen 52:06 – Miksi pitkäaikainen koulutus on tärkeää 55:28 – SFT: päättelyn perustan rakentaminen 1:04:53 – Preferenssisäätö ja miksi DPO toimii edelleen 1:10:51 – Vaikea osa: RLVR, pitkät päättelyketjut ja infrastruktuurin kipu 1:13:59 – Miksi RL on niin teknisesti brutaali 1:18:17 – Monimutkaisuusvero vs AGI-hype 1:21:58 – Kuinka jokainen voi edistää tekoälyn tulevaisuutta 1:27:26 – Loppusanat
... avoin **lähde** tekoälykilpailu, d'oh 🤦 ♂️
331