跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+5.15%
USELESS
+3.48%
IKUN
+1.92%
gib
+17.31%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+3.22%
ALON
-3.21%
LAUNCHCOIN
-1.02%
GOONC
+10.67%
KLED
+2.9%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.55%
Boopa
-1.16%
PORK
-1.7%
主頁
elvis
使用 AI 代理進行構建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享瞭如何使用 LLM 和 AI 代理⬇️進行構建的見解
查看原文
elvis
50 分鐘前
Meta及其合作夥伴的新研究。 這是一篇很好的論文,展示了使用適當的世界模型所能實現的可能性。 世界模型需要行動來預測後果。當前的默認方法需要標記的行動數據,這種數據獲取成本高且僅限於狹窄的領域,如視頻遊戲或機器人操作。 但在線上大多數視頻數據根本沒有行動標籤。 這項新研究直接從野外視頻中學習潛在的行動世界模型,超越了以往工作的受控環境,捕捉真實世界行動的全部多樣性。 這個挑戰是相當大的。野外視頻包含的行動遠超簡單的導航或操作:人們進入畫面、物體出現和消失、舞者移動、手指形成吉他和弦。視頻之間也沒有一致的具體化,與機器人數據集不同,後者的同一隻手臂在整個過程中出現。 那麼,作者是如何解決這個問題的呢? 使用稀疏或嘈雜的正則化,持續但受限的潛在行動有效地捕捉了這種行動的複雜性。離散量化,先前工作的常見方法,難以適應。沒有共享的具體化,模型學習到的是空間局部化的、相機相對的變換。 結果展示了真正的行動轉移。 行走者的運動可以應用於飛行的球。像「某人進入畫面」這樣的行動可以在完全不同的視頻之間轉移。 通過訓練一個小型控制器將已知行動映射到潛在行動,純粹基於自然視頻訓練的世界模型可以以接近於基於特定領域、標記行動數據的模型的性能解決機器人操作和導航任務。 從未標記的互聯網視頻中學習的潛在行動空間可以作為規劃的通用接口,消除行動標註的瓶頸。 論文: 在我們的學院學習如何建立有效的AI代理:
74
elvis
19 小時前
Claude 代碼用於您其餘的工作。 我已經在使用 Claude Agent SDK 建立小應用程式。 現在變得更簡單了。
28
熱門
排行
收藏