По словам разработчиков и пользователей, у Claude Code в последние месяцы появились признаки ухудшения поведения:
глубина “мышления” модели заметно сократилась;
количество итераций стало расти;
стоимость API-вызовов могла увеличиваться кратно;
часть процесса анализа теперь скрывается из интерфейса.
Особенно много вопросов вызвало поведение функции redact-thinking, которая скрывает ход рассуждений модели. Формально это может быть просто UI-изменением, но на практике пользователям стало гораздо сложнее понять, почему именно растут расходы и падает качество.
Главная находка — это баг, связанный с режимом Extra Usage.
Claude Code должен запрашивать у сервера кэш либо на 1 час, либо на 5 минут. Но если система замечает, что пользователь вошёл в режим сверхлимита, клиент тихо, без предупреждения, переключается на кэш в 5 минут.
Это очень дорого обходится пользователю.
Если человек сделал паузу больше чем на 5 минут — например, отошёл по делам — следующая сессия уже может потребовать полного пересчёта контекста. То есть деньги начинают списываться гораздо быстрее.
По оценке автора:
при контексте 220K токенов кэш на 1 час стоит около $0.22 за цикл;
кэш на 5 минут — уже около $0.61.
Иными словами, короткий кэш примерно в 1.8 раза дороже.
Проблема не ограничивается одним неудачным переключением. Она создаёт эффект снежного кома:
другие баги ускоряют расход обычного лимита;
лимит заканчивается;
включается Extra Usage;
клиент сокращает кэш до 5 минут;
любое короткое бездействие запускает полный перерасчёт;
деньги сгорают ещё быстрее.
Так возникает “петля смерти”: чем ближе пользователь к превышению лимита, тем хуже становится поведение системы. Помимо этого, есть ещё 6 багов.
1. Проблема с нативным установщиком
Официальный бинарный пакет содержит кастомный Bun runtime, который портит префикс кэша при каждом запросе.
Что делать:
перейти на установку через npm install;
проверить результат командой file $(which claude).
В норме это должен быть символический линк, а не ELF-бинарник.
2. Потеря типа вложений при восстановлении сессии
В версиях v2.1.69–v2.1.90 при восстановлении сессии терялся важный тип вложений. Из-за этого каждая такая сессия превращалась в полное промахивание мимо кэша.
Эта ошибка уже исправлена в v2.1.91.
3. Бесконечные попытки авто-сжатия
Функция автоматического сжатия не имела механизма остановки после неудачи. Если сжатие ломалось, система могла бесконечно пытаться повторить операцию.
Внутренние комментарии к коду упоминали 1279 сессий, где происходило более 50 неудачных попыток подряд. Эта проблема тоже исправлена, начиная с v2.1.89.
4. Обрезка результатов инструментов на клиенте
У инструментов есть жёсткие лимиты вывода:
Bash — до 30K символов;
Grep — до 20K символов.
Если результат обрезается, кэш-префикс ломается, а это снова ухудшает кэширование.
5. Скрытое переключение кэша в Extra Usage
Это основной баг, о котором уже сказано выше.
6. Фальшивые ошибки лимита
При больших диалогах клиент иногда показывает фальшивую ошибку лимита: model: synthetic, token = 0, хотя реального API-вызова вообще не было. На момент публикации баг всё ещё не был исправлен.
7. Серверное удаление результатов инструментов
Есть и серверная проблема: механизм сжатия на сервере может молча удалить результаты инструментов прямо во время сессии, без какого-либо уведомления пользователю. Это также ломает кэш и не может быть исправлено со стороны клиента.
Эти баги работают не как простая сумма проблем, а как множитель. То есть если пользователь одновременно сталкивается с несколькими из них, расход токенов может расти лавинообразно. Например, при совпадении багов 1, 3 и 5 лимит недели может быть сожжён менее чем за два часа.
Рекомендации следующие:
если используется официальный бинарный пакет — перейти на npm-установку;
обновиться до v2.1.91 или новее;
при наличии навыков можно вручную поправить JS-файл и заставить функцию TTL всегда запрашивать 1 час кэша.
Но есть важный нюанс: после обновления патч, скорее всего, придётся ставить заново.
В Claude Code v2.1.92 появилось больше прозрачности в учёте расходов:
команда /cost теперь показывает детализацию стоимости по моделям и по кэш-хитам;
появилась явная подсказка о том, что кэш истёк;
пользователь видит, сколько токенов уйдёт без кэша в следующем запросе.
Это уже лучше, чем скрытое списание, но одновременно и напоминание о том, что каждый лишний запрос может оказаться очень дорогим.
История с Claude Code — это не просто рассказ о нескольких багах. Это пример того, как в AI-инструменте проблема прозрачности может быстро превратиться в проблему доверия.
Пользователь хочет предсказуемый инструмент, который помогает работать. Но если продукт начинает менять правила в скрытом режиме — сокращает кэш, прячет ход рассуждений, не даёт понять, почему растут расходы, — доверие рушится очень быстро.
Именно поэтому эта история вызвала такой резонанс: на кону не только токены, но и уверенность разработчиков в том, что инструмент ведёт себя честно.
Источник
Обсуждение на Reddit
sms_systems@inbox.ru
+ 7 (985) 982-70-55