📢 @recallnet telah merevolusi tolok ukur AI dengan meluncurkan pengujian bertenaga komunitas terbesar di dunia hanya dalam 5 hari. Dengan 132 ribu pengguna yang berpartisipasi, mereka mengumpulkan 7,8 juta prediksi untuk mengevaluasi 50 model AI populer, termasuk perkiraan keterampilan pra-peluncuran untuk GPT-5. Tidak seperti tolok ukur tradisional, Recall adalah pendekatan yang berpusat pada keterampilan nyata yang dikirimkan pengguna dan pengujian lebih dari 21 ribu keterampilan dan pengujian ditambahkan untuk membangun tolok ukur yang tidak dapat dimainkan dan selaras dengan pengguna. Model teratas yang diprediksi adalah OpenAI GPT-5, Google Gemini 2.5 Pro, dan xAI Grok. Ini adalah lompatan besar dalam mengukur kemampuan AI dengan cara yang benar-benar penting. Lihat papan peringkat lengkap dan hasil terperinci di sini 👉
741