В AI-среде есть особый вид хвастовства: не количеством пользователей, не капитализацией и даже не числом моделей, а объёмом сожжённых токенов. И теперь этот показатель стал по-настоящему астрономическим.
По данным, которые озвучила Volcano Engine, среднесуточное использование токенов у модели Doubao превысило 120 триллионов токенов в день. Для сравнения: три месяца назад речь шла о 60 триллионах, а в момент запуска модели в мае 2024 года — лишь о тысячной доле от нынешнего уровня.
Это уже не просто рост. Это масштаб, который показывает, что AI-инфраструктура начинает жить по логике промышленного производства.
Если грубо оценить стоимость по рыночным тарифам на входные токены в Китае, речь идёт примерно о 3–5 млрд юаней расходов в день только на вычисления. В год это превращается в сотни миллиардов юаней, то есть в расходы сопоставимые с выручкой крупнейших корпораций.
И это только одна компания, одна платформа и один день.
Но ещё важнее не абсолютная цифра, а то, что она отражает: AI перестаёт быть историей про отдельные запросы и превращается в постоянный производственный поток.
На форуме China Development Forum 2026 прозвучала ещё более впечатляющая цифра: среднесуточный объём токенных вызовов в Китае превысил 140 триллионов. Для сравнения, в начале 2024 года этот показатель был около 100 миллиардов. Рост — более чем в тысячу раз за два года.
По данным OpenRouter, в третью неделю марта глобальный объём вызовов AI-моделей составил 20,4 триллиона токенов, из которых Китай обеспечил 7,359 триллиона — то есть 36% мирового объёма.
Отдельно стоит отметить, что среди компаний, потребляющих более 100 триллионов токенов в день, сейчас выделяются всего три игрока: OpenAI, Google и ByteDance. Причём первые две компании опираются на глобальный рынок, а ByteDance — в основном на китайский. Это очень сильный сигнал: Китай уже вышел в мировые лидеры по масштабам потребления AI.
Главная причина — переход от чат-ботов к агентам.
В эпоху обычного общения с моделью всё было относительно просто: пользователь задавал вопрос, модель отвечала, и на этом цикл заканчивался. Несколько сотен токенов — и готово.
С агентами всё иначе. Агент должен:
понять задачу;
распланировать шаги;
вызвать инструменты;
проверить результат;
при ошибке скорректироваться;
иногда повторить процесс несколько раз.
В результате один сложный сценарий может потреблять в десятки или даже сотни раз больше токенов, чем обычный диалог.
Именно поэтому сегодня токены стали новой единицей AI-экономики.
Одним из символов новой эпохи стал ArkClaw — агентный инструмент, связанный с экосистемой Volcano Engine.
Он умеет интегрироваться с разными корпоративными сервисами: Feishu, WeChat, DingTalk, Weibo и другими. Каждое такое подключение — это не просто удобство, а ещё и огромный поток токенов, проходящий через систему.
По словам представителей компании, для успешного внедрения агентов бизнесу нужны три вещи:
модель — как «мозг» системы;
безопасность — как ограничитель и защита;
навыки (Skills) — как рабочие руки и инструменты.
Без этого агент не станет массовым продуктом.
Показательна и статистика по клиентам платформы: число компаний, у которых совокупное потребление превысило 1 триллион токенов, выросло с 100 до 140 всего за несколько месяцев.
Это уже не экспериментальный сегмент. Это формирование нового класса корпоративных потребителей AI-инфраструктуры.
При этом компании всё чаще делят внедрение агентов на два типа:
«Гибкие» агенты — для экспериментов, креативных задач, тестирования рабочих сценариев;
«Стабильные» агенты — для бизнес-процессов, где ошибки недопустимы: договоры, производство, операции.
Именно сочетание этих двух подходов создаёт новый цикл роста: сначала сотрудники пробуют AI как личного помощника, затем лучшие практики превращаются в стандарты компании, а потом — в масштабируемые API и Skills.
На фоне взрывного роста спроса меняется и экономика рынка. В марте сразу несколько крупных игроков пересмотрели тарифы:
Zhipu дважды за месяц подняла цены;
Alibaba Cloud и Baidu Cloud увеличили стоимость AI-услуг;
Tencent Cloud изменил тарифную модель для платформы разработки агентов;
за рубежом AWS и Google Cloud тоже подняли цены на отдельные AI- и облачные сервисы.
Это не случайность. Когда спрос на AI-вычисления растёт быстрее, чем мощности дата-центров, цена неизбежно идёт вверх.
Токены нельзя накопить «про запас». Они не становятся ценностью сами по себе. Их производят и тут же потребляют. Поэтому AI-инфраструктура всё меньше похожа на обычный софт-бизнес и всё больше — на промышленный сектор, где важны:
мощности,
энергопотребление,
дата-центры,
доступ к вычислениям,
контроль над цепочкой поставки.
Именно поэтому Nvidia, по сути, уже описывает будущее как мир, где дата-центры — это не хранилища данных, а фабрики по производству токенов.
120 триллионов токенов в день — это не просто впечатляющая статистика. Это признак того, что AI-индустрия вошла в стадию масштабного промышленного потребления.
Больше не вопрос, может ли модель ответить на запрос. Вопрос в другом:
сколько токенов она сожжёт,
кто это оплатит,
и кто контролирует инфраструктуру, на которой этот поток держится.
Похоже, именно токены становятся новой универсальной единицей AI-экономики. А тот, кто управляет их производством, получает не просто рынок, а право на его правила.
sms_systems@inbox.ru
+ 7 (985) 982-70-55