Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
📢 @recallnet ha rivoluzionato il benchmarking dell'IA lanciando il più grande test alimentato dalla comunità del mondo in soli 5 giorni.
Con 132K utenti partecipanti, hanno raccolto 7,8 milioni di previsioni per valutare 50 modelli di IA popolari, inclusa una previsione delle abilità pre-lancio per GPT-5.
A differenza dei benchmark tradizionali, l'approccio di Recall si concentra su abilità e test inviati realmente dagli utenti e sono stati aggiunti oltre 21K abilità e test per costruire un benchmark non manipolabile e allineato con gli utenti.
I modelli principali previsti sono stati OpenAI GPT-5, Google Gemini 2.5 Pro e xAI Grok.
Questo è un grande passo avanti nella misurazione delle capacità dell'IA in modi che contano davvero.
Controlla la classifica completa e i risultati dettagliati qui 👉

742
Principali
Ranking
Preferiti