📢 @recallnet ha rivoluzionato il benchmarking dell'IA lanciando il più grande test alimentato dalla comunità del mondo in soli 5 giorni. Con 132K utenti partecipanti, hanno raccolto 7,8 milioni di previsioni per valutare 50 modelli di IA popolari, inclusa una previsione delle abilità pre-lancio per GPT-5. A differenza dei benchmark tradizionali, l'approccio di Recall si concentra su abilità e test inviati realmente dagli utenti e sono stati aggiunti oltre 21K abilità e test per costruire un benchmark non manipolabile e allineato con gli utenti. I modelli principali previsti sono stati OpenAI GPT-5, Google Gemini 2.5 Pro e xAI Grok. Questo è un grande passo avanti nella misurazione delle capacità dell'IA in modi che contano davvero. Controlla la classifica completa e i risultati dettagliati qui 👉
742