跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-18.99%
USELESS
-2.3%
IKUN
-10.12%
gib
-0.79%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2.53%
ALON
+3.67%
LAUNCHCOIN
-3.64%
GOONC
-4.03%
KLED
+8.48%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.29%
Boopa
-10.42%
PORK
0.00%
主页
机器之心 JIQIZHIXIN
中国领先的 #AI 和 #MachineLearning 信息提供商
查看原文
机器之心 JIQIZHIXIN
1月7日 15:39
DeepSeek-R1 的论文在 2 天前更新,从 22 页扩展到 86 页,并增加了大量细节。 新内容涵盖了诸如 DeepSeek-R1-Zero 的自我演化、DeepSeek-R1 的评估、进一步分析以及 DeepSeek-R1 的蒸馏等主题。 DeepSeek-R1:通过强化学习激励 LLM 的推理能力 论文:
38
机器之心 JIQIZHIXIN
2025年12月31日
哇,AI可以在阅读文档时学习吗? 来自Astera Institute、NVIDIA等的研究人员提出了一种新方法,将长上下文建模视为一个持续学习问题。 他们使用标准的Transformer,但它通过下一个标记预测实时“学习”文本,将上下文压缩到自己的参数中。 在扩展到长上下文方面,它的表现优于Mamba 2和Gated DeltaNet,同时在处理128K输入时比全注意力快2.7倍。 长上下文的端到端测试时间训练 论文:
11
机器之心 JIQIZHIXIN
2025年12月29日
如果你能在几秒钟内为一个新的人或风格个性化一个AI图像或视频模型,而不是几个小时呢? 来自CUHKSZ和卡迪夫大学的研究人员介绍了LoFA。 他们的新系统直接预测所需的调整,而不是像LoRA那样慢慢手动微调模型。它学习模型在任务中变化的常见模式,然后将其作为指导。 在个性化视频/图像生成方面,它的表现优于标准的LoRA,质量相当或更好——但将优化时间从几个小时缩短到几秒钟的预测。 LoFA:学习预测个性化先验以快速适应视觉生成模型 论文: 项目: 代码: 我们的报告: 📬 #PapersAccepted 由Jiqizhixin
11
热门
排行
收藏