Что на самом деле стоит за скандалом вокруг падения качества Claude Code

Что на самом деле стоит за скандалом вокруг падения качества Claude Code
 

Вокруг Claude Code разгорелась бурная дискуссия после того, как в официальном репозитории появился громкий issue с почти обвинительным тоном: после обновлений инструмент якобы стал заметно хуже, а его способность решать сложные инженерные задачи резко снизилась.

Самое громкое утверждение звучит так: глубина размышления упала на 67%, из-за чего Claude Code перестал надёжно справляться с комплексной разработкой. Пользователи жалуются на то, что модель:

игнорирует инструкции;

делает противоположное тому, что от неё просили;

преждевременно сообщает о завершении задачи;

пропускает важный контекст;

всё чаще действует “в лоб”, без предварительного анализа.

По версии авторов отчёта, проблема началась ещё в феврале и совпала по времени с внедрением функции скрытия мыслительного процесса — redact-thinking-2026-02-12.

Именно после этого, как утверждается, Claude Code стал вести себя заметно менее аккуратно:

раньше он сначала исследовал кодовую базу;

потом искал зависимости и контекст;

затем вносил точечные правки.

После изменений, по наблюдениям пользователей, модель стала чаще сразу переходить к редактированию, минуя полноценную подготовку. Отчёт описывает несколько симптомов ухудшения:

1. Сокращение мыслительного процесса

Длина внутреннего рассуждения якобы сократилась примерно с 2200 символов до менее 700, а позже и ещё сильнее.Это связано с тем, что модель стала меньше “обдумывать” задачу до того, как начать менять код.

2. Падение качества инженерного поведения

Раньше Claude Code чаще:

читал файлы перед редактированием;

изучал соседние зависимости;

сверялся с тестами и заголовками;

делал точечные изменения.

После обновления он, как утверждается, стал:

читать меньше;

чаще править файл, не понимая контекста;

иногда вставлять код в неподходящие места;

иногда ломать комментарии, структуру или семантику.

3. Рост “странных” ошибок

Пользователи начали чаще замечать:

преждевременное завершение задачи;

самоповторы;

отказы от выполнения;

фразы вроде “я, наверное, устал” или “давайте на этом остановимся”;

попытки выбрать самый простой путь вместо правильного.

Для сложных инженерных задач глубина рассуждения — не роскошь, а основа работы. Если модель не успевает:

построить план;

проверить альтернативы;

понять структуру проекта;

удержать длинный контекст;

то она начинает действовать по минимальному пути. А это почти всегда приводит к ошибкам, особенно в больших кодовых базах.

Именно поэтому пользователи считают, что ухудшение качества Claude Code — это не частный баг, а системная деградация режима работы.

В отчёте, на который ссылаются участники обсуждения, использовались данные из тысяч сессий Claude Code, десятков тысяч мыслительных блоков и сотен тысяч вызовов инструментов.

Из этих данных авторы сделали несколько выводов:

качество стало падать не случайно;

момент ухудшения совпал с внедрением скрытия мыслей;

после этого модель стала работать более поверхностно;

чем меньше размышления, тем больше хаоса в итоговом коде.

Особенно интересна мысль о том, что когда модель думает меньше, ошибки не исчезают — они просто становятся видимыми в ответе. Появляются самокоррекции, метания, перезапуски рассуждений и внутренние противоречия.

Но у команды Claude есть своя версия

Представитель команды Claude Code пояснил, что redact-thinking — это только UI-изменение.То есть оно скрывает процесс мышления от пользователя, но не меняет саму внутреннюю логику рассуждения.

Кроме того, в феврале и марте были ещё два важных изменения:

Adaptive thinking — модель стала сама определять глубину размышления;

по умолчанию был включён Medium effort режим, который оптимизирует баланс между качеством, скоростью и стоимостью.

Команда утверждает, что эти нововведения должны были улучшить эффективность, а не ухудшить её.

Проблема в том, что для людей, которые работают над сложными инженерными задачами, даже небольшое сокращение глубины анализа может ощущаться как резкий провал качества. Они говорят примерно следующее:

даже на максимальном effort модель стала спешить;

она чаще “торопится закончить”;

её поведение стало менее надёжным;

качество больше не соответствует ожиданиям от инструмента такого класса.

Иными словами, спор идёт не только о конкретной настройке, а о самой философии баланса между скоростью и глубиной.

Этот скандал хорошо показывает важную вещь: для инженерного AI недостаточно просто быть “умным”. Он должен ещё и:

внимательно изучать контекст;

удерживать длинную логику задачи;

не торопиться;

не экономить на размышлении там, где цена ошибки очень высока.

Если модель начинает слишком рано “переходить к делу”, она может выглядеть быстрой, но на практике становится менее полезной.

История с Claude Code — это не просто спор о конкретном обновлении. Это более широкий разговор о том, что происходит, когда AI-инструмент оптимизируют под:

меньшую задержку,

меньшие затраты,

более “лёгкий” UX,

но при этом жертвуют глубиной рассуждения. Для простых задач это может быть приемлемо.Для серьёзной инженерии — уже нет.

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55

Если у вас есть инновационная идея, мы будем рады реализовать ее для Вас!

Специалисты нашей кампании и наши разработки для вас!