El artículo de DeepSeek-R1 se actualizó hace 2 días, ampliándose de 22 a 86 páginas y añadiendo una cantidad considerable de detalle. El nuevo contenido aborda temas como la autoevolución de DeepSeek-R1-Zero, la evaluación de DeepSeek-R1, análisis adicionales y la destilación de DeepSeek-R1. DeepSeek-R1: Incentivando la capacidad de razonamiento en LLMs mediante aprendizaje por refuerzo Papel: