跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+3.81%
USELESS
+2.85%
IKUN
+0.84%
gib
+14.94%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.1%
ALON
-3.63%
LAUNCHCOIN
-3.44%
GOONC
+10.38%
KLED
+0.06%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.05%
Boopa
-1.16%
PORK
-1.7%
主頁
elvis
使用 AI 代理進行構建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享瞭如何使用 LLM 和 AI 代理⬇️進行構建的見解
查看原文
elvis
17 小時前
Claude 代碼用於您其餘的工作。 我已經在使用 Claude Agent SDK 建立小應用程式。 現在變得更簡單了。
24
elvis
1月12日 21:55
關於代理記憶的精彩論文。 LLM 代理需要長期和短期記憶來處理複雜任務。 然而,當前的默認方法將這些視為獨立的組件,每個組件都有自己的啟發式、控制器和優化策略。 但記憶並不是兩個獨立的系統。它是一個認知過程,決定了什麼要存儲、檢索、總結和遺忘。 這項新研究介紹了 AgeMem,一個統一的框架,通過基於工具的行動將長期和短期記憶管理直接整合到代理的策略中。 代理不再依賴基於觸發的規則或輔助記憶管理器,而是學會了何時以及如何調用記憶操作:ADD、UPDATE、DELETE 用於長期存儲,RETRIEVE、SUMMARY、FILTER 用於上下文管理。 它使用三階段的漸進式強化學習策略。首先,模型學習長期記憶存儲。然後它掌握短期上下文管理。最後,在完整任務設置下協調兩者。 為了處理來自記憶操作的碎片化經驗,他們設計了一個逐步的 GRPO(群體相對策略優化),將跨階段依賴轉化為可學習的信號。 在五個長期基準測試中的結果: > 在 Qwen2.5-7B 上,AgeMem 的平均得分為 41.96,而 Mem0 為 37.14,提升了 13%。 > 在 Qwen3-4B 上,差距擴大:54.31 對 44.70。僅添加長期記憶就提供了 +10-14% 的增益。 > 添加強化學習訓練再增加 +6%。 > 完整的統一系統結合兩種記憶類型,實現了相較於無記憶基準的 +21.7% 的提升。 通過可學習的基於工具的行動進行的統一記憶管理超越了碎片化的啟發式管道,使代理能夠根據任務需求自適應地決定記住和遺忘什麼。 論文: 在我們的學院學習如何建立有效的 AI 代理:
326
熱門
排行
收藏