Artykuł DeepSeek-R1 został zaktualizowany 2 dni temu, rozszerzając się z 22 stron do 86 stron i dodając znaczną ilość szczegółów. Nowa treść obejmuje tematy takie jak samorozwój DeepSeek-R1-Zero, ocena DeepSeek-R1, dalsza analiza oraz destylacja DeepSeek-R1. DeepSeek-R1: Motywowanie zdolności rozumowania w LLM za pomocą uczenia przez wzmocnienie Artykuł: