一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN-3.64%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

机器之心 JIQIZHIXIN

中国领先的 #AI 和 #MachineLearning 信息提供商

机器之心 JIQIZHIXIN

机器之心 JIQIZHIXIN1月7日 15:39

DeepSeek-R1 的论文在 2 天前更新，从 22 页扩展到 86 页，并增加了大量细节。新内容涵盖了诸如 DeepSeek-R1-Zero 的自我演化、DeepSeek-R1 的评估、进一步分析以及 DeepSeek-R1 的蒸馏等主题。 DeepSeek-R1：通过强化学习激励 LLM 的推理能力论文：

38

机器之心 JIQIZHIXIN

机器之心 JIQIZHIXIN2025年12月31日

哇，AI可以在阅读文档时学习吗？来自Astera Institute、NVIDIA等的研究人员提出了一种新方法，将长上下文建模视为一个持续学习问题。他们使用标准的Transformer，但它通过下一个标记预测实时“学习”文本，将上下文压缩到自己的参数中。在扩展到长上下文方面，它的表现优于Mamba 2和Gated DeltaNet，同时在处理128K输入时比全注意力快2.7倍。长上下文的端到端测试时间训练论文：

11

机器之心 JIQIZHIXIN

机器之心 JIQIZHIXIN2025年12月29日

如果你能在几秒钟内为一个新的人或风格个性化一个AI图像或视频模型，而不是几个小时呢？来自CUHKSZ和卡迪夫大学的研究人员介绍了LoFA。他们的新系统直接预测所需的调整，而不是像LoRA那样慢慢手动微调模型。它学习模型在任务中变化的常见模式，然后将其作为指导。在个性化视频/图像生成方面，它的表现优于标准的LoRA，质量相当或更好——但将优化时间从几个小时缩短到几秒钟的预测。 LoFA：学习预测个性化先验以快速适应视觉生成模型论文：项目：代码：我们的报告： 📬 #PapersAccepted 由Jiqizhixin

11

热门

排行

收藏

©2017 - 2026 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币发现开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入社群比特币钱包以太坊钱包 Solana 钱包