El documento de DeepSeek-R1 se actualizó hace 2 días, ampliándose de 22 páginas a 86 páginas y añadiendo una cantidad sustancial de detalles. El nuevo contenido abarca temas como la auto-evolución de DeepSeek-R1-Zero, la evaluación de DeepSeek-R1, un análisis más profundo y la destilación de DeepSeek-R1. DeepSeek-R1: Incentivando la Capacidad de Razonamiento en LLMs a través del Aprendizaje por Refuerzo Documento: