Claude Code за неделю сжигает половину лимита за один день

Claude Code за неделю сжигает половину лимита за один день
 

По словам разработчиков и пользователей, у Claude Code в последние месяцы появились признаки ухудшения поведения:

глубина “мышления” модели заметно сократилась;

количество итераций стало расти;

стоимость API-вызовов могла увеличиваться кратно;

часть процесса анализа теперь скрывается из интерфейса.

Особенно много вопросов вызвало поведение функции redact-thinking, которая скрывает ход рассуждений модели. Формально это может быть просто UI-изменением, но на практике пользователям стало гораздо сложнее понять, почему именно растут расходы и падает качество.

Главная находка — это баг, связанный с режимом Extra Usage.

Claude Code должен запрашивать у сервера кэш либо на 1 час, либо на 5 минут. Но если система замечает, что пользователь вошёл в режим сверхлимита, клиент тихо, без предупреждения, переключается на кэш в 5 минут.

Это очень дорого обходится пользователю.

Если человек сделал паузу больше чем на 5 минут — например, отошёл по делам — следующая сессия уже может потребовать полного пересчёта контекста. То есть деньги начинают списываться гораздо быстрее.

По оценке автора:

при контексте 220K токенов кэш на 1 час стоит около $0.22 за цикл;

кэш на 5 минут — уже около $0.61.

Иными словами, короткий кэш примерно в 1.8 раза дороже.

Проблема не ограничивается одним неудачным переключением. Она создаёт эффект снежного кома:

другие баги ускоряют расход обычного лимита;

лимит заканчивается;

включается Extra Usage;

клиент сокращает кэш до 5 минут;

любое короткое бездействие запускает полный перерасчёт;

деньги сгорают ещё быстрее.

Так возникает “петля смерти”: чем ближе пользователь к превышению лимита, тем хуже становится поведение системы. Помимо этого, есть ещё 6 багов.

1. Проблема с нативным установщиком

Официальный бинарный пакет содержит кастомный Bun runtime, который портит префикс кэша при каждом запросе.

Что делать:

перейти на установку через npm install;

проверить результат командой file $(which claude).

В норме это должен быть символический линк, а не ELF-бинарник.

2. Потеря типа вложений при восстановлении сессии

В версиях v2.1.69–v2.1.90 при восстановлении сессии терялся важный тип вложений. Из-за этого каждая такая сессия превращалась в полное промахивание мимо кэша.

Эта ошибка уже исправлена в v2.1.91.

3. Бесконечные попытки авто-сжатия

Функция автоматического сжатия не имела механизма остановки после неудачи. Если сжатие ломалось, система могла бесконечно пытаться повторить операцию.

Внутренние комментарии к коду упоминали 1279 сессий, где происходило более 50 неудачных попыток подряд. Эта проблема тоже исправлена, начиная с v2.1.89.

4. Обрезка результатов инструментов на клиенте

У инструментов есть жёсткие лимиты вывода:

Bash — до 30K символов;

Grep — до 20K символов.

Если результат обрезается, кэш-префикс ломается, а это снова ухудшает кэширование.

5. Скрытое переключение кэша в Extra Usage

Это основной баг, о котором уже сказано выше.

6. Фальшивые ошибки лимита

При больших диалогах клиент иногда показывает фальшивую ошибку лимита: model: synthetic, token = 0, хотя реального API-вызова вообще не было. На момент публикации баг всё ещё не был исправлен.

7. Серверное удаление результатов инструментов

Есть и серверная проблема: механизм сжатия на сервере может молча удалить результаты инструментов прямо во время сессии, без какого-либо уведомления пользователю. Это также ломает кэш и не может быть исправлено со стороны клиента.

Эти баги работают не как простая сумма проблем, а как множитель. То есть если пользователь одновременно сталкивается с несколькими из них, расход токенов может расти лавинообразно. Например, при совпадении багов 1, 3 и 5 лимит недели может быть сожжён менее чем за два часа.

Рекомендации следующие:

если используется официальный бинарный пакет — перейти на npm-установку;

обновиться до v2.1.91 или новее;

при наличии навыков можно вручную поправить JS-файл и заставить функцию TTL всегда запрашивать 1 час кэша.

Но есть важный нюанс: после обновления патч, скорее всего, придётся ставить заново.

В Claude Code v2.1.92 появилось больше прозрачности в учёте расходов:

команда /cost теперь показывает детализацию стоимости по моделям и по кэш-хитам;

появилась явная подсказка о том, что кэш истёк;

пользователь видит, сколько токенов уйдёт без кэша в следующем запросе.

Это уже лучше, чем скрытое списание, но одновременно и напоминание о том, что каждый лишний запрос может оказаться очень дорогим.

История с Claude Code — это не просто рассказ о нескольких багах. Это пример того, как в AI-инструменте проблема прозрачности может быстро превратиться в проблему доверия.

Пользователь хочет предсказуемый инструмент, который помогает работать. Но если продукт начинает менять правила в скрытом режиме — сокращает кэш, прячет ход рассуждений, не даёт понять, почему растут расходы, — доверие рушится очень быстро.

Именно поэтому эта история вызвала такой резонанс: на кону не только токены, но и уверенность разработчиков в том, что инструмент ведёт себя честно.

Источник

Обсуждение на Reddit

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55

Если у вас есть инновационная идея, мы будем рады реализовать ее для Вас!

Специалисты нашей кампании и наши разработки для вас!