Makalah bagus tentang Memori Agen. Agen LLM membutuhkan memori jangka panjang dan jangka pendek untuk menangani tugas-tugas yang kompleks. Namun, pendekatan default saat ini memperlakukan ini sebagai komponen terpisah, masing-masing dengan heuristik, pengontrol, dan strategi pengoptimalannya sendiri. Tapi memori bukanlah dua sistem independen. Ini adalah salah satu proses kognitif yang memutuskan apa yang harus disimpan, diambil, diringkas, dan dilupakan. Penelitian baru ini memperkenalkan AgeMem, kerangka kerja terpadu yang mengintegrasikan manajemen memori jangka panjang dan jangka pendek langsung ke dalam kebijakan agen melalui tindakan berbasis alat. Alih-alih mengandalkan aturan berbasis pemicu atau manajer memori tambahan, agen mempelajari kapan dan bagaimana memanggil operasi memori: ADD, UPDATE, DELETE untuk penyimpanan jangka panjang, dan RETRIEVE, SUMMARY, FILTER untuk manajemen konteks. Ini menggunakan strategi RL progresif tiga tahap. Pertama, model mempelajari penyimpanan memori jangka panjang. Kemudian menguasai manajemen konteks jangka pendek. Akhirnya, ia mengoordinasikan keduanya di bawah pengaturan tugas penuh. Untuk menangani pengalaman terfragmentasi dari operasi memori, mereka merancang GRPO (Pengoptimalan Kebijakan Relatif Grup) secara bertahap yang mengubah dependensi lintas tahap menjadi sinyal yang dapat dipelajari. Hasil di lima tolok ukur jangka panjang: > Pada Qwen2.5-7B, AgeMem mencapai skor rata-rata 41.96 dibandingkan dengan 37.14 untuk Mem0, peningkatan 13%. > Pada Qwen3-4B, kesenjangan melebar: 54,31 vs 44,70. Menambahkan memori jangka panjang saja memberikan keuntungan +10-14%. > Menambahkan pelatihan RL menambahkan +6% lagi. > Sistem terpadu penuh dengan kedua jenis memori mencapai peningkatan hingga +21,7% dibandingkan garis dasar tanpa memori. Manajemen memori terpadu melalui tindakan berbasis alat yang dapat dipelajari mengungguli alur heuristik yang terfragmentasi, memungkinkan agen untuk secara adaptif memutuskan apa yang harus diingat dan dilupakan berdasarkan tuntutan tugas. Kertas: ...