跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+5.51%
USELESS
+1.41%
IKUN
+0.69%
gib
+14.58%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+0.61%
ALON
-4.39%
LAUNCHCOIN
-1.76%
GOONC
+7.53%
KLED
+0.6%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.05%
Boopa
-1.16%
PORK
-1.7%
主页
elvis
使用 AI 代理进行构建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享了如何使用 LLM 和 AI 代理⬇️进行构建的见解
查看原文
elvis
16 小时前
Claude 代码用于您其余的工作。 我已经通过使用 Claude Agent SDK 构建小应用程序来做到这一点。 现在变得更简单了。
22
elvis
23 小时前
关于代理记忆的优秀论文。 LLM代理需要长期和短期记忆来处理复杂任务。 然而,今天的默认方法将这些视为独立的组件,每个组件都有自己的启发式、控制器和优化策略。 但记忆并不是两个独立的系统。它是一个认知过程,决定存储、检索、总结和遗忘什么。 这项新研究引入了AgeMem,一个统一框架,通过基于工具的动作将长期和短期记忆管理直接集成到代理的策略中。 代理不再依赖于基于触发的规则或辅助记忆管理器,而是学习何时以及如何调用记忆操作:ADD、UPDATE、DELETE用于长期存储,RETRIEVE、SUMMARY、FILTER用于上下文管理。 它使用三阶段渐进式强化学习策略。首先,模型学习长期记忆存储。然后,它掌握短期上下文管理。最后,它在完整任务设置下协调两者。 为了处理来自记忆操作的碎片化经验,他们设计了一种逐步的GRPO(组相对策略优化),将跨阶段依赖关系转化为可学习的信号。 在五个长时间基准测试中的结果: > 在Qwen2.5-7B上,AgeMem的平均得分为41.96,而Mem0为37.14,提升了13%。 > 在Qwen3-4B上,差距扩大:54.31对44.70。仅添加长期记忆就提供了+10-14%的增益。 > 添加强化学习训练再增加+6%。 > 完整的统一系统结合两种记忆类型在没有记忆的基线之上实现了高达+21.7%的提升。 通过可学习的基于工具的动作进行统一的记忆管理优于碎片化的启发式管道,使代理能够根据任务需求自适应地决定记住和遗忘什么。 论文: 在我们的学院学习如何构建有效的AI代理:
303
热门
排行
收藏