Le document de DeepSeek-R1 a été mis à jour il y a 2 jours, passant de 22 pages à 86 pages et ajoutant une quantité substantielle de détails. Le nouveau contenu couvre des sujets tels que l'auto-évolution de DeepSeek-R1-Zero, l'évaluation de DeepSeek-R1, une analyse plus approfondie et la distillation de DeepSeek-R1. DeepSeek-R1 : Incitation à la capacité de raisonnement dans les LLM via l'apprentissage par renforcement Document :