Ещё недавно большой контекст считался главным преимуществом современных ИИ-моделей. Чем больше токенов — тем умнее система, тем больше данных она может «держать в голове». Но теперь сами разработчики признают: это не совсем так.
Anthropic открыто заявила о проблеме, которую назвала context rot — «гниение контекста». Суть проста: чем длиннее диалог и чем больше информации загружено в модель, тем хуже она начинает работать.
Причина — в ограниченности внимания. Внутри контекстного окна оказываются не только актуальные данные, но и старые сообщения, неудачные попытки, лишние файлы и промежуточные результаты. Всё это конкурирует за «внимание» модели и превращается в шум. В итоге ИИ начинает хуже понимать задачу и чаще ошибается.
Особенно парадоксально это выглядит на фоне заявлений о «миллионном контексте». Формально он есть, но это не значит, что все эти токены одинаково полезны. На практике значительная часть превращается в балласт.
Чтобы решить проблему, Anthropic предложила набор из пяти стратегий — по сути, новую дисциплину работы с ИИ, которую уже называют «инженерией контекста».
Первая и самая простая — продолжать диалог, если контекст ещё актуален. Но это работает только на коротких дистанциях.
Вторая — возврат (rewind). Вместо того чтобы исправлять ошибки внутри текущего диалога, лучше откатиться к моменту до ошибки и пойти по другой ветке. Это позволяет убрать «мусор» из контекста и сохранить только полезную информацию.
Третья — полная очистка (clear). Начать новый диалог, вручную описав ключевые факты. Это самый «чистый», но и самый трудоёмкий способ.
Четвёртая — сжатие (compact). Модель сама суммирует предыдущий диалог и оставляет только краткое содержание. Удобно, но рискованно: можно потерять важные детали, особенно если модель уже «устала» от перегрузки.
Пятая — субагенты (subagents). Это, пожалуй, самый интересный подход: отдельные задачи выносятся в изолированные контексты, а в основной диалог возвращается только результат. Таким образом, основной поток остаётся «чистым», без лишнего шума.
По сути, Anthropic предлагает относиться к каждому сообщению как к точке принятия решения: продолжать, откатываться, очищать или изолировать задачу.
Отдельно компания подчёркивает ещё одну проблему — стоимость. Большие контексты не только ухудшают качество, но и резко увеличивают расходы. Поэтому появился инструмент /usage, который позволяет отслеживать потребление и лимиты.
Всё это указывает на важный сдвиг: эпоха «просто пиши хороший промпт» заканчивается. На смену приходит более сложный навык — управление контекстом.
Если раньше ключевым было то, что сказать модели, то теперь всё чаще важно, что не показывать ей.
В этом смысле большой контекст — это не только преимущество, но и ответственность. Он даёт мощность, но требует дисциплины. И те, кто научится грамотно управлять этим ресурсом, будут получать от ИИ гораздо более стабильные и качественные результаты.
sms_systems@inbox.ru
+ 7 (985) 982-70-55