Пожалуй, лучшая маркетинговая фраза последних лет в мире потребительского ИИ звучала просто: «200 долларов в месяц — пользуйся сколько хочешь». Подписки типа ChatGPT Pro или Claude Max быстро привлекли массовых пользователей, упростив донельзя сложную APIмодель ценообразования и сделав нейросети массовым продуктом.
Но недавний отчёт аналитиков SemiAnalysis показал, что за этой картинкой скрывается серьёзная экономика: при экстремальном использовании подписки могут обходиться поставщикам в тысячи долларов — и тогда модель оказывается убыточной.
Что показал стресстест SemiAnalysis смоделировал сценарии интенсивного, «реального» потребления — долгие сессии программирования, сложные Agentворкфлоу, многократные вызовы модели с длинным контекстом. Затем полученные вызовы пересчитали по официальным APIтарифам:
для ChatGPT Pro (план с множителем 20×, $200/мес) теоретическая себестоимость при полном использовании квоты может достигать примерно $14 000 в месяц на пользователя;
для Claude Max при том же ценнике — около $8 000 теоретических затрат.
Это означает: при «максимальной» нагрузке пользователь платит платформе лишь малую долю реальной стоимости вычислений. Даже если в реальности большинство пользователей не расходуют квоту целиком, подобные оценки выявляют уязвимость бизнесмодели — прибыльность определяется не ценой подписки, а фактической степенью её использования.
Критические пороги и кто в худшем положении Аналитики посчитали и пороги, при которых подписки переходят в минус:
у Anthropic — примерно 20% фактического использования приводит к нулевой марже для Pro/Max 5×;
у OpenAI — порог ещё ниже: около 11–12% использования для стандартных paidпланов уже ставит работу в убыточную зону; для топпланов ситуация ещё более критична.
Сам Sam Altman публично признавал: растущая «tokenжадность» и новые сценарии использования создают давление на экономику компании.
Раньше основной сценарий ChatGPT — короткие текстовые диалоги, ограниченный контекст, небольшое число токенов. Сейчас повсеместно растут тяжёлые сценарии: автогенерация кода, многоэтапные Agentпроцессы, обработка больших контекстов и потоков, где расход токенов может быть в сотни или тысячи раз выше. В некоторых Agentзадачах расход действительно достигает порядка 1000× обычного promptа.
Как на это реагируют корпорации Крупные компании уже начали ограничивать внутреннее потребление: Microsoft, Meta, Amazon ужесточили правила использования AI сотрудниками.
Практика «динамической маршрутизации» — переключение задач между тяжёлыми и лёгкими моделями в зависимости от сложности — показала до 95% экономии в отдельных кейсах. Некоторые стартапы и продукты полностью мигрировали трафик на более дешёвые, но достаточно качественные opensource или конкурентные модели (например, DeepSeek V4 и другие).
Чего ждать рынку Тенденция кажется очевидной: подписки останутся удобными для массовых и «легких» сценариев; топуровень «неограниченного» доступа по фиксированной цене — нежизнеспособен при росте тяжёлых кейсов. Вероятный результат — гибрид: базовые возможности по подписке, премиумфункции и intensivecompute задачи по API/поиспользованию. Параллельно оживлённо растёт рынок opensource моделей, которые сокращают разрыв и дают альтернативу дорогим проприетарным inferenceрешениям.
«200 долларов в месяц» как маркетинговая формула работала — но теперь рынок переходит в фазу рационализации: кто и как платит за вычисления, станет ключевым экономическим фактором AIэкосистемы.
Подписка останется важным каналом монетизации, но он не заменит необходимости честной экономики использования — особенно в эпоху, когда Agentприложения и длительные сессии становятся нормой.
sms_systems@inbox.ru
+ 7 (985) 982-70-55