Bài báo của DeepSeek-R1 đã được cập nhật cách đây 2 ngày, mở rộng từ 22 trang lên 86 trang và thêm một lượng lớn chi tiết. Nội dung mới đề cập đến các chủ đề như sự tự tiến hóa của DeepSeek-R1-Zero, đánh giá DeepSeek-R1, phân tích thêm, và chưng cất DeepSeek-R1. DeepSeek-R1: Khuyến khích khả năng lý luận trong LLMs thông qua học tăng cường Bài báo: