Il documento di DeepSeek-R1 è stato aggiornato 2 giorni fa, espandendosi da 22 pagine a 86 pagine e aggiungendo una quantità sostanziale di dettagli. Il nuovo contenuto copre argomenti come l'auto-evoluzione di DeepSeek-R1-Zero, la valutazione di DeepSeek-R1, ulteriori analisi e la distillazione di DeepSeek-R1. DeepSeek-R1: Incentivare la capacità di ragionamento negli LLM tramite l'apprendimento per rinforzo Documento: