Когда в прошлом году вышел DeepSeek V3, реакция рынка была почти восторженной. Тогда это воспринималось как большой прорыв: китайская команда показала, что может создавать сильные модели уровня мировых лидеров, при этом делая это заметно дешевле и эффективнее.
Обсуждали всё — качество, стоимость, инженерные решения, экономику инференса. Для многих DeepSeek тогда стал символом того, что конкурировать с OpenAI, Anthropic и Google можно не только деньгами, но и архитектурной смекалкой.
Но с DeepSeek V4 ситуация оказалась совсем другой. Модель тоже получилась сильной: лучше кодинг, лучше длинный контекст, лучше многошаговое рассуждение, сильнее работа с китайским языком и сложной логикой. Однако рыночный эффект уже не тот. Да, разработчики тестируют, сравнивают, спорят, но той волны восторга, как в эпоху V3, больше нет. И дело не в том, что модель слабая. Дело в том, что сам рынок изменился.
Главная мысль материала очень точная: в 2026 году побеждает уже не просто лучший LLM, а лучший AI-workflow. Пользователи и разработчики всё меньше обсуждают сами названия моделей и всё чаще говорят о том, в каком агентном фреймворке они работают. Не «я использую GPT-5.5», а «я работаю в Codex». Не «я использую Claude 4.7», а «я работаю в Claude Code».
Это важный сдвиг. Раньше индустрия жила в логике чат-ботов: кто умнее отвечает, кто лучше пишет тексты, кто точнее проходит бенчмарки. Теперь всё сместилось в сторону выполнения задач. Вопрос уже не в том, может ли модель красиво ответить. Вопрос в том, может ли она:
понять структуру большого проекта;
менять десятки файлов подряд;
пользоваться терминалом;
самостоятельно исправлять ошибки;
держать длинный контекст;
не терять цель на длинной дистанции;
работать как полноценный агент.
И вот здесь простая, даже очень хорошая модель уже недостаточна. Она может быть отличным «мозгом», но без системы вокруг не становится полноценным рабочим инструментом.
У DeepSeek V4 есть сильные стороны, и спорить с этим бессмысленно. Но многие разработчики сегодня оценивают не абстрактное качество модели, а стоимость выполнения конкретной задачи. И тут оказывается, что дешевый токен не всегда означает дешевый результат.
В статье приводятся типичные жалобы: на одних и тех же задачах DeepSeek V4 может работать дольше, чем Codex или Claude Code, а иногда вообще не доводить задачу до конца с первого раза. В реальной разработке это критично. Если модель дольше думает, чаще ошибается и требует больше ручного вмешательства, то формально низкая цена токена уже не выглядит преимуществом.
Именно поэтому разработчики всё чаще говорят не о цене за миллион токенов, а о цене за завершенную задачу. Если один инструмент решает вопрос за один проход, а другой требует многократных попыток, ручных правок и дополнительных вызовов, итоговая стоимость может оказаться выше у «дешевой» модели.
Одна из ключевых претензий к DeepSeek V4 в том, что это пока прежде всего модель, а не полноценный продукт. В отличие от Claude Code и Codex, у DeepSeek нет настолько же зрелой вертикальной интеграции между моделью, интерфейсом, инструментами, контекстом, файловой системой и логикой выполнения задач.
Именно поэтому многие считают, что DeepSeek V4 не хватает собственного аналога Codex.
Потому что в новой реальности выигрывает не просто LLM, а LLM + Agent framework. Причем агентный слой — это уже не вспомогательная оболочка, а половина ценности продукта. Без него модель может быть умной, но не будет удобной, стабильной и продуктивной в работе.
Это и есть то, что в материале называют смещением рынка в сторону AgentOS-конкуренции. То есть конкурируют уже не просто базовые модели, а целые операционные среды для ИИ-работы.
Успех Codex и Claude Code объясняется именно тем, что они решают не только задачу генерации текста или кода, но и задачу организации работы.
Они умеют:
удерживать рабочий контекст;
понимать структуру репозитория;
действовать с учетом набора файлов и зависимостей;
запускать инструменты;
продолжать работу после ошибок;
распределять задачи;
работать как полуавтономный исполнитель.
Это уже не просто «чат с моделью». Это рабочая среда, где модель получает тело, инструменты и правила действия.
Именно поэтому многие разработчики сегодня не сравнивают голые модели, а сравнивают именно продукты поверх них. В этом смысле DeepSeek V4 действительно выглядит как сильный мотор без готовой коробки передач и шасси.
Отдельно важен еще один тезис: бенчмарки больше не определяют победителя. Раньше индустрия с большим вниманием следила за MMLU, SWE-Bench и другими тестами. Но в реальной работе выяснилось, что хорошие цифры на тестах вовсе не гарантируют удобной и надежной работы в боевой среде.
Сейчас разработчики куда больше доверяют собственному опыту:
сколько времени модель реально тратит;
сколько ручных исправлений требует;
насколько стабильно работает на длинной задаче;
как ведет себя в цепочке инструментов;
может ли завершить задачу без «расползания» контекста.
То есть benchmark уже не главный судья. Судья — это production.
Если смотреть стратегически, DeepSeek V4 показывает, что компания уже находится в высшей лиге по качеству самой модели. Но если она хочет конкурировать с OpenAI и Anthropic не только по уважению, а по реальной доле использования, ей нужен следующий шаг — собственная агентная экосистема.
Появление сторонних решений вроде DeepSeek TUI — это хороший знак. Это значит, что сообщество уже видит запрос на такой продукт. Но сторонние инструменты не заменяют официальной платформы. Им не хватает глубокой интеграции, понимания архитектуры модели и полного контроля над пользовательским опытом.
Именно поэтому главный вызов для DeepSeek сегодня — не просто сделать еще более умный LLM, а превратить его в рабочую систему, где модель, инструменты и сценарии использования будут связаны в единое целое.
DeepSeek V4 — это не провал и не разочарование. Это сильная модель, которая всё еще входит в число лидеров. Но рыночная реальность 2026 года такова, что модель сама по себе уже не является главным конкурентным преимуществом.
Побеждает не тот, у кого просто лучше ответы на тестах, а тот, у кого:
есть сильная модель;
есть удобный агентный слой;
есть зрелый рабочий процесс;
есть надежная интеграция с инструментами;
есть возможность доводить задачи до результата.
Иными словами, модель — это только билет на вход. А финал выигрывает тот, у кого есть Codex.
sms_systems@inbox.ru
+ 7 (985) 982-70-55