📢 @recallnet ha revolucionado la evaluación de IA al lanzar la prueba comunitaria más grande del mundo en solo 5 días. Con 132K usuarios participando, recopilaron 7.8 millones de predicciones para evaluar 50 modelos de IA populares, incluyendo una previsión de habilidades previa al lanzamiento para GPT-5. A diferencia de los benchmarks tradicionales, el enfoque de Recall se centra en habilidades y pruebas enviadas por usuarios reales, y se añadieron más de 21K habilidades y pruebas para construir un benchmark alineado con los usuarios y que no se pueda manipular. Los modelos más destacados predichos fueron OpenAI GPT-5, Google Gemini 2.5 Pro y xAI Grok. Este es un gran avance en la medición de las capacidades de IA de maneras que realmente importan. Consulta la tabla de clasificación completa y los resultados detallados aquí 👉
820