Lucrare excelentă despre Memoria Agentică. Agenții LLM au nevoie atât de memorie pe termen lung, cât și de memorie pe termen scurt pentru a gestiona sarcini complexe. Totuși, abordarea implicită de astăzi le tratează ca pe componente separate, fiecare cu propriile euristici, controlere și strategii de optimizare. Dar memoria nu este două sisteme independente. Este un proces cognitiv care decide ce să stocheze, să recuperezi, să rezume și ce să uite. Această nouă cercetare introduce AgeMem, un cadru unificat care integrează managementul memoriei pe termen lung și pe termen scurt direct în politica agentului prin acțiuni bazate pe instrumente. În loc să se bazeze pe reguli bazate pe trigger sau manageri auxiliari de memorie, agentul învață când și cum să invoce operațiunile de memorie: ADD, UPDATE, DELETE pentru stocare pe termen lung și RETRIEVE, SUMMARY, FILTER pentru gestionarea contextului. Folosește o strategie progresivă RL în trei etape. În primul rând, modelul învață stocarea memoriei pe termen lung. Apoi stăpânește gestionarea contextului pe termen scurt. În final, le coordonează pe ambele sub setări complete de sarcini. Pentru a gestiona experiențele fragmentate din operațiunile de memorie, ei proiectează un GRPO pas cu pas (Group Relative Policy Optimization) care transformă dependențele cross-stage în semnale ușor de învățat. Rezultatele din cinci repere pe termen lung: > Pe Qwen2.5-7B, AgeMem obține un scor mediu de 41,96, comparativ cu 37,14 pentru Mem0, o îmbunătățire de 13%. > Pe Qwen3-4B, diferența se mărește: 54,31 față de 44,70. Adăugarea memoriei pe termen lung doar oferă câștiguri de +10-14%. > Adăugarea antrenamentului RL adaugă încă +6%. > Sistemul complet unificat cu ambele tipuri de memorie obține o îmbunătățire de până la +21,7% față de liniile de bază fără memorie. Gestionarea unificată a memoriei prin acțiuni bazate pe unelte care pot fi învățate depășește fluxurile euristice fragmentate, permițând agenților să decidă adaptiv ce să țină minte și ce să uite în funcție de cerințele sarcinilor. Hârtie: ...