LMARENA, maailmankuulu suurten mallien kilpailulista, laskee kaikki mallit, jotka ovat olleet suurten mallien kärjessä vuoden 2023 puolivälistä lähtien GPT-4:stä alkaen malli voi pysyä ykköspaikalla keskimäärin vain noin 35 päivää. Ei puoli vuotta, ei vuosi, vaan yli kuukausi menee uuden mallin varjoon. Vielä liioiteltumpaa on, että monet mallit putoavat Top 5:stä noin viisi kuukautta huipulle pääsyn jälkeen, ja on vaikea pitää Top 10:ssä edes seitsemän kuukauden päästä. Konkreettisten esimerkkien tarkastelu on vaikuttavampi: O1, joka oli aiemmin kaunis, on nyt sijalla #56; Claude 3 Opus, jota tuolloin pidettiin "vahvimpana päättelymallina", on pudonnut sijalle #139 He kaikki olivat ennen: Huippumalli on paljon keskusteltu ja sitä pidetään "johtavan sukupolven" tuotteena Kukaan ei voi seistä listan kärjessä pitkään, ja etuikkuna on tiivistynyt "kuukausien" yksikköön. Kun malli voidaan ohittaa seuraava sukupolvi keskimäärin 35 päivässä, se ylittää jopa joidenkin tekoälytuotteiden iterointisylin... 😄 Tämä voi tarkoittaa keskeistä asiaa: mallin perusominaisuudet paranevat jopa nopeammin kuin useimpien tuotteiden iterointisykli. Tuotekerros "taaksepäin litistetään" mallin ominaisuuksien mukaan.