Společnost Anthropic oznámila řešení dlouhodobého problému ve vývoji agentů AI: udržování paměti během dlouhých úkolů. Tento problém, běžný v podnikových aplikacích, způsobuje, že agenti „zapomenou“ předchozí instrukce nebo kontext, jak se relace prodlužují, což způsobuje nekonzistentní a nespolehlivé chování. To je důležité, protože nasazení umělé inteligence v reálném světě vyžaduje agenty, kteří mohou pracovat autonomně hodiny, dny nebo i déle, aniž by ztratili ze zřetele své cíle.
Problém paměti agenta
Základní modely, včetně těch používaných v agentech AI, jsou omezeny velikostí kontextového okna – množstvím textu, které mohou zpracovat najednou. Při práci na složitých projektech agenti nevyhnutelně pracují ve více relacích, což vytváří kritickou mezeru v kontinuitě. Bez spolehlivé paměti mohou opakovat práci, dělat nelogická rozhodnutí nebo prohlásit úkol za dokončený předčasně. To vedlo k prudkému nárůstu řešení zaměřených na paměť, přičemž společnosti jako LangChain, Memobase a OpenAI (Swarm) nabízejí rámce k překlenutí této mezery. Zrychluje se také akademický výzkum, projekty jako Memp a Nested Learning Paradigm společnosti Google posouvají hranice paměti agentů.
Antropické dvousložkové řešení
Přístup společnosti Anthropic má za cíl překonat tato omezení v rámci sady Claude Agent SDK. Namísto spoléhání se pouze na zvětšení velikosti kontextového okna nabízí společnost systém dvou agentů:
– Inicializační agent: Nastavuje prostředí protokolováním průběhu a závislostí.
– Coding Agent: Provádí postupná vylepšení v každé relaci a ponechává jasné aktualizace pro další iteraci.
To napodobuje pracovní postup softwarových vývojářů, kteří rozdělují složité úkoly do zvládnutelných kroků, dokumentují pokrok a staví na předchozí práci. Společnost Anthropic zjistila, že pouhé zadání vágního cíle agentovi („vytvořit klon claude.ai“) vedlo ke dvěma běžným chybám: buď se agent pokusil udělat příliš mnoho najednou, překročil kontextové limity, nebo předčasně vyhlásil ukončení poté, co vygeneroval pouze částečné řešení.
Testování a budoucí výzkum
Antropičtí výzkumníci integrovali testovací nástroje do kódovacího agenta, což mu umožnilo identifikovat a opravit chyby, které nebyly z kódu zřejmé. Společnost si uvědomuje, že toto je pouze jedno možné řešení v rychle se vyvíjející oblasti. Zůstává nejasné, zda univerzální kódovací agent překoná specializované multiagentní struktury.
Současné testy se zaměřují na vývoj plnohodnotných webových aplikací, ale Anthropic věří, že principy platí i pro jiné oblasti, včetně vědeckého výzkumu a finančního modelování. Klíčový závěr je jasný: ** Spolehlivá dlouhodobá paměť pro agenty vyžaduje strukturované prostředí, postupný pokrok a konzistentní záznam – odrážející osvědčené postupy lidského vývoje softwaru.**
