Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Skvělý článek o agentické paměti.
Agenti LLM potřebují jak dlouhodobou, tak krátkodobou paměť pro zvládání složitých úkolů.
Dnes je však výchozí přístup považován za samostatné komponenty, z nichž každá má své vlastní heuristiky, řídicí systémy a optimalizační strategie.
Ale paměť není dva nezávislé systémy. Je to jeden z kognitivních procesů, který rozhoduje, co uložit, vyvolat, shrnout a zapomenout.
Tento nový výzkum představuje AgeMem, jednotný rámec, který integruje správu dlouhodobé a krátkodobé paměti přímo do politiky agenta prostřednictvím nástrojových akcí.
Místo spoléhání se na pravidla založená na spouštěči nebo pomocné správce paměti se agent učí, kdy a jak spustit paměťové operace: ADD, UPDATE, DELETE pro dlouhodobé ukládání a RETRIEVE, SUMMARY, FILTER pro správu kontextu.
Používá třífázovou progresivní RL strategii. Nejprve se model učí ukládání dlouhodobé paměti. Pak zvládne krátkodobé řízení kontextu. Nakonec koordinuje obě funkce pod plnými nastaveními úkolů.
Aby zvládli fragmentované zkušenosti z paměťových operací, navrhují krokový GRPO (Group Relative Policy Optimization), který převádí závislosti mezi jednotlivými úrovněmi na naučitelné signály.
Výsledky v rámci pěti dlouhodobých benchmarků:
> V Qwen2.5-7B dosahuje AgeMem průměrného skóre 41,96 oproti 37,14 u Mem0, což je zlepšení o 13 %.
> Na Qwen3-4B se rozdíl zvětšuje: 54,31 vs 44,70. Samotné přidání dlouhodobé paměti přináší +10–14 % zisků.
> Přidání tréninku reálného života přidává dalších +6 %.
> Plně sjednocený systém s oběma typy paměti dosahuje až +21,7% zlepšení oproti základním verzím bez paměti.
Jednotná správa paměti prostřednictvím naučitelných akcí založených na nástrojích překonává fragmentované heuristické pipeline, což umožňuje agentům adaptivně rozhodovat, co si zapamatovat a zapomenout na základě požadavků úkolu.
Článek:
...

Top
Hodnocení
Oblíbené
