Логика экономики вычислительных мощностей полностью меняется в эпоху ИИ-агентов

Строева Марина

4 апреля компания Anthropic, долго терпевшая ситуацию, объявила о блокировке доступа сторонних клиентов к подпискам Claude Pro/Max. Это вызвало бурную реакцию в сообществе разработчиков, привыкших использовать прокси-инструменты вроде OpenClaw и OpenCode для дешевого доступа к топовым моделям.

Параллельно команда Xiaomi AI и аналитик Ло Фули критиковали хаос в распределении вычислительных ресурсов в индустрии интеллектуальных агентов. Эти независимые события выявили фундаментальную истину: эпоха «бесплатных обедов» в интернете заканчивается, и вычислительные мощности возвращаются к своему статусу ограниченного и дорогостоящего ресурса.

В эпоху SaaS подписка была основой бизнеса: большинство пользователей платили мало, компенсируя расходы за счет редких, но интенсивных пользователей. Но в эпоху ИИ-агентов эта модель перестала работать.

Агенты, такие как OpenClaw, требуют многократных вызовов моделей и постоянного обновления контекста, что приводит к взрывному росту потребления токенов — иногда в сотни и тысячи раз больше, чем при обычном диалоге с чат-ботом.

Если сравнить подписку с абонементом в спортзал, то раньше пользователи приходили на час, а теперь — с целой командой «неутомимых едоков» на бесконечный шведский стол.

При текущих ценах API Claude Opus 4.6, несколько часов интенсивной работы агента могут стоить сотни долларов, что делает подписку убыточной для провайдеров.

Anthropic, Google и OpenAI уже начали жестко ограничивать сторонние подключения, чтобы остановить «черную дыру» в расходах на вычисления.

Эволюция моделей оплаты

API с прозрачной оплатой по вызовам — самый честный, но дорогой и пугающий пользователей способ.

Coding Plan — подписка с ограничением по количеству запросов, но с непрозрачным подсчетом вызовов моделей, что приводит к ухудшению пользовательского опыта.

Token Plan — новая модель, введенная Xiaomi и Tencent, где пользователю четко выделяется квота токенов на период, что позволяет лучше контролировать расходы и оптимизировать использование.

Сложность в том, что современные агентские фреймворки плохо управляют контекстом: они часто пересылают полные объемы данных при каждом запросе, игнорируя кэширование и оптимизацию. Это приводит к огромным издержкам на вычисления и снижает эффективность.

Как отметил разработчик SGLang Чжао Чэньян, это похоже на «полив цветов пожарным шлангом» — огромные ресурсы тратятся впустую из-за неэффективного дизайна.

Итоги и перспективы

Конец эпохи «бесплатных вычислений». Вычислительные мощности становятся дорогим и ограниченным ресурсом.

Необходимость дисциплины в расходах токенов. Только при высокой стоимости токенов разработчики будут мотивированы создавать эффективные решения.

Переход от «жесткого» масштабирования к интеллектуальной оптимизации. В эпоху агентов важна не просто мощность, а умение максимально эффективно её использовать.

AGI пока остается мечтой. Текущие модели и алгоритмы далеки от универсального интеллекта.

Как резюмировал Ло Фули: эпоха агентов принадлежит не тем, кто жадно сжигает вычислительные ресурсы, а тем, кто умеет использовать их с умом и максимальной отдачей.

НОВЫЕ СТАТЬИ

22 октября, 2024

Автоматизация аналитики продаж на маркетплейсах:…

22 октября, 2024

Как анализ отзывов и оценок…

22 октября, 2024

Анализ динамики цен и стратегии…

22 октября, 2024

Интеграция данных о продажах с…

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55