Anthropic оголосила про вирішення давньої проблеми у розробці агентів ШІ: збереження пам’яті під час тривалих завдань. Ця проблема, поширена в корпоративних програмах, змушує агентів «забувати» попередні інструкції або контекст у міру подовження сеансів, спричиняючи неузгоджену та ненадійну поведінку. Це важливо, оскільки для розгортання штучного інтелекту в реальному світі потрібні агенти, які можуть працювати автономно протягом годин, днів або навіть довше, не втрачаючи з поля зору своїх цілей.
Проблема з пам’яттю агента
Базові моделі, включно з тими, що використовуються в агентах штучного інтелекту, обмежені розміром контекстного вікна — обсягом тексту, який вони можуть обробити одночасно. Працюючи над складними проектами, агенти неминуче працюють у кількох сесіях, створюючи критичний розрив безперервності. Без надійної пам’яті вони можуть повторювати роботу, приймати нелогічні рішення або оголошувати завдання виконаним передчасно. Це призвело до різкого зростання кількості орієнтованих на пам’ять рішень, і такі компанії, як LangChain, Memobase і OpenAI (Swarm), пропонують фреймворки для подолання цього розриву. Академічні дослідження також прискорюються: такі проекти, як Memp і Google Nested Learning Paradigm, розширюють межі пам’яті агентів.
Антропне двокомпонентне рішення
Підхід Anthropic спрямований на подолання цих обмежень у своєму SDK Claude Agent. Замість того, щоб покладатися виключно на збільшення розміру контекстного вікна, компанія пропонує систему з двох агентів:
– Агент ініціалізації: налаштовує середовище шляхом реєстрації прогресу та залежностей.
– Coding Agent: робить поступові вдосконалення в кожному сеансі, залишаючи чіткі оновлення для наступної ітерації.
Це імітує робочий процес розробників програмного забезпечення, які розбивають складні завдання на керовані кроки, документують прогрес і спираються на попередню роботу. Anthropic виявив, що просте надання агенту нечіткої мети («створити клон claude.ai») призвело до двох поширених помилок: або агент намагався зробити занадто багато одночасно, перевищуючи обмеження контексту, або передчасно оголосив про завершення роботи після створення лише часткового рішення.
Тестування та майбутні дослідження
Антропічні дослідники інтегрували інструменти тестування в кодуючий агент, дозволяючи йому виявляти та виправляти помилки, які не були очевидні з коду. Компанія визнає, що це лише одне з можливих рішень у сфері, що швидко розвивається. Залишається незрозумілим, чи перевершить універсальний агент кодування спеціалізовані багатоагентні структури.
Поточні тести зосереджені на розробці повнофункціональних веб-додатків, але Anthropic вважає, що принципи застосовуються в інших сферах, включаючи наукові дослідження та фінансове моделювання. Ключовий висновок очевидний: Надійна довготривала пам’ять для агентів потребує структурованого середовища, поступового прогресу та постійного запису, що відображає перевірені практики розробки програмного забезпечення людьми.





























