В мае 2026 года сразу два технологических гиганта — Alibaba Cloud и Google — синхронно подали один и тот же сигнал рынку: основным “пользователем” облака становится не человек, а AIагент.
И это не красивая метафора про «умные ассистенты повсюду», а практическая смена интерфейсов, метрик и даже стратегии по чипам. Если раньше облако продавалось инженерам через каталоги сервисов, консоли и панели, то теперь его начинают продавать как набор вызываемых способностей — «skills», протоколов и предсказуемых ответов для машинного исполнителя.
Новый сайт Qianwen Cloud, запущенный Alibaba Cloud: на главной странице нет списка продуктов, нет привычной навигации, нет «консоли». Есть только инструкция, читаемая агентом:
Skills npx skills add QianWen-AI/qianwen-ai
То есть: «установи навык и подключайся». Это почти манифест: вход в облако перестраивается под того, кто не кликает мышью. Агенту не нужна витрина, ему нужен договор о вызовах — что можно сделать, как вызвать, какие ограничения и какой будет результат.
Alibaba Cloud прямо формулирует вывод, к которому они пришли внутри: «в будущем облачные продукты будут ориентироваться главным образом на агентов, а не на человеческих инженеров».
Отсюда и позиционирование как «чистого forAI/forAgent» интерфейса, где приоритет меняется местами: раньше человек приходил за базой данных, теперь агент приходит за моделью и возможностью действовать.
Появление популярных агентных продуктов означает, что ресурсы в облаке могут активироваться без человека. Там, где раньше инженер мог тратить недели на согласования и настройку, агент «молча» поднимает нужные вычисления в фоне — за день.
В результате привычная логика облака («человек изучает меню → выбирает сервис → руками конфигурирует») становится для агента бессмысленной. Он не читает сайты, не ищет кнопки — он вызывает возможности.
Отсюда вытекает более глубокая перестройка: облако превращается из «магазина сервисов» в машиночитаемую операционную среду для действий.
Перестройка входа — видимая часть, но причина в другом: взрывной рост tokenнагрузки и то, что она начинает приносить деньги.
Google показывает многократные скачки месячного объёма обработанных токенов за несколько лет (рост ускоряется, причём последний год — ещё примерно в 7 раз).
Gartner прогнозирует, что к концу 2026 года 40% корпоративных приложений будут интегрировать AIагентов (годом ранее — менее 5%).
Ключевая мысль Alibaba Cloud: пока AI был «про повышение эффективности», его доля в ITбюджетах выглядела небольшой. Но когда появились сильные codingвозможности, случился перелом: AI стал делать то, что человеку трудно делать быстро и массово — например, декомпозировать и переносить “кодовые окаменелости” (старые COBOL/C/Javaсистемы без документации и с ушедшими разработчиками) в современную инфраструктуру. А это уже не «ускорение существующего процесса», а генератор нового спроса на облако.
Ещё один фактор — скачки в возможностях новых крупных моделей (включая рассуждение и видео), которые иногда «обнуляют» ценность длительной тонкой настройки опенсорсмоделей под данные клиента. Это меняет расчёт ROI и повышает готовность платить за мощные базовые модели.
В результате, по словам спикера в материале, структура расходов на токены выглядит так:
AInative стартапы: токены могут составлять до 100% ITзатрат,
интернеткомпании: 15–20%,
традиционные предприятия: пока <5%.
И важное уточнение: «видеотокены» и «токены рассуждения/текста» нельзя просто сваливать в одну статистику — рынок нужно считать по модальности и по типу модели, иначе искажается понимание ёмкости и маржинальности.
AIсервисы должны продаваться как коммунальные услуги (по потреблению) или как бизнесрезультат?
Ответ звучит так: конечная цель — “платёж за результат”, но индустрия пока живёт в модели «плата за объём»; при этом уже видны ранние сигналы, что клиенты готовы платить за outcome, если агент закрывает «жёсткую» потребность и встраивается в ядро процессов.
Отсюда новые KPI для продаж и продукта: не просто выручка, а рост числа tokenплатящих клиентов, степень интеграции в ключевые системы, эффективность закрытого цикла «модель → агент → действие → результат».
Когда токены становятся денежным мотором, выясняется, что узкое место не в UX и не в маркетинге, а в физике: чипы, датацентры, электроэнергия. Поэтому параллельно с «agentic cloud» включается второй разворот — к собственным чипам и полному стеку.
Alibaba Cloud на этом фоне публично показывает дорожную карту и объясняет мотивацию: агент в миллисекунды может инициировать десятки вызовов модели, значит, нужны согласованные CPU/GPU/сеть/хранилище — системная оптимизация, которую проще сделать на своём железе. В тексте это прямо сравнивается с «классическим путём Google»: TPU + Gemini как связка, дающая лучшую экономику и производительность.
Google со своей стороны тоже усиливает линию собственных TPU, а также демонстрирует замкнутый контур «чип → модель → платформа → агент в продуктах» (Vertex AI, Gemini, агентные функции в поиске и т.д.), подкрепляя это огромными планами по капзатратам.
Общая логика конкуренции, сформулированная в материале, меняется так:
было: «у кого больше GPU»,
становится: «кто при меньшей себестоимости чипа выдаст больше и качественнее токенов».
Это уже соревнование не только в “скорости” модели, но и в эффективности всего конвейера «электричество → вычисления → токены → деньги».
Символ эпохи — главная страница облака, которая выглядит как команда терминалу, а не как витрина для людей. Google и Alibaba показывают, что облако перестраивается под нового потребителя — агента; рост измеряется токенами; монетизация постепенно движется от «платы за расход» к «плате за результат»; а стратегическое преимущество всё сильнее смещается к контролю над физическим стеком и собственным чипам.
«Эпоха сервисов для людей» не исчезает — но перестаёт быть центром. Центр теперь там, где агент получает доступ к навыкам, вызывает модели, подключает инфраструктуру и делает работу без участия человека.
sms_systems@inbox.ru
+ 7 (985) 982-70-55