Еще совсем недавно казалось, что серьёзный ИИ обязательно должен работать в облаке: нужны серверы, API, подписка и постоянная оплата токенов. Но новый открытый модельный релиз Google — Gemma 4 — показал, что часть ИИ-задач уже можно запускать прямо на телефоне, без обращения к удалённым серверам.
Это важный сигнал. Потому что он ставит большой вопрос: насколько далеко мы от эпохи, где за каждое обращение к ИИ не придётся платить токенами?
Gemma 4 сразу привлекла внимание не только тем, что это новая открытая модель, но и тем, что она:
построена на архитектуре, связанной с Gemini 3;
поддерживает нативную мультимодальность;
показывает сильные результаты в рейтингах;
имеет компактные версии, которые можно запускать прямо на смартфоне.
Особенно интересны небольшие версии модели — их уже можно использовать локально на телефоне. Именно это стало главным поводом для обсуждения: ИИ больше не обязательно “живет” в облаке.
Появились демонстрации, где Gemma 4 запускали на iPhone и использовали для довольно разных задач:
анализ изображений;
работа с аудио;
управление функциями устройства;
простые разговорные сценарии;
базовое рассуждение.
Для многих это выглядит почти как магия: модель работает быстро, реагирует на запросы на устройстве и не требует постоянного интернет-доступа.
Если раньше локальный ИИ на телефоне казался игрушкой для энтузиастов, то теперь это всё больше напоминает практический сценарий для повседневного использования.
Главная ценность здесь не в том, что можно “поиграться” с моделью на смартфоне.Главное в другом: часть ИИ-задач можно выполнять без облака и без оплаты токенов.
Это меняет целую экономику использования ИИ.
Если обычные запросы, простые объяснения, базовая генерация текста, распознавание изображений и часть кодовых задач будут выполняться локально, то:
пользователю не придётся отправлять всё в облако;
снизится стоимость использования;
уменьшится зависимость от API-провайдеров;
улучшится приватность;
повысится скорость отклика.
То есть появляется шанс на будущее, где “маленький ИИ” всегда под рукой и работает прямо на устройстве.
Gemma 4 тестировали не только на смартфонах, но и на более мощных устройствах, например на MacBook с чипами Apple Silicon. В таких условиях модель может выглядеть очень достойно в обычном диалоге, генерации текста и даже в помощи с кодом.
Однако, когда её начинают использовать как полноценного coding agent, проблемы становятся заметнее.
Где начинаются ограничения
Для агентных сценариев нужны:
длинный контекст;
сложные многошаговые инструкции;
устойчивый вызов инструментов;
строгий структурированный вывод;
хорошая работа с файлами, командами и состояниями.
И вот здесь Gemma 4, по отзывам некоторых пользователей, начинает спотыкаться.Она может:
зависать;
выдавать ошибки;
ломать формат;
не выдерживать сложный многопользовательский или многошаговый сценарий.
Это не обязательно означает, что модель “слабая”. Скорее, она, может быть, не до конца оптимизирована именно под агентный режим.
Даже если модель пока не идеальна как агент, сам факт её появления очень важен. Потому что локальные модели постепенно становятся достаточно хорошими для задач, которые делают ИИ массово полезным:
повседневные вопросы;
простая аналитика;
локальная работа с изображениями и аудио;
черновики текстов;
простое кодогенерирование;
быстрые подсказки без подключения к серверу.
А это уже прямой вызов облачным сервисам, которые зарабатывают на токенах.
Что будет с рынком токенов
Если всё больше задач начнут выполняться локально, то бизнес-модель “плати за каждый запрос” столкнётся с давлением. Но это не означает смерть облачного ИИ. Скорее рынок разделится на две части:
1. Локальный ИИ
Он будет закрывать:
бытовые запросы,
простые задачи,
приватные сценарии,
офлайн-работу,
быстрые повседневные взаимодействия.
2. Облачный ИИ
Он останется сильнее там, где нужны:
очень сложные рассуждения;
длинные и надёжные контексты;
несколько агентов одновременно;
доступ к свежим данным;
тяжёлая вычислительная инфраструктура;
сложные корпоративные процессы.
То есть облако не исчезнет, но его монополия на ИИ-сервисы уже не выглядит неизбежной.
Gemma 4 — это не просто ещё одна новая модель. Это пример того, как ИИ постепенно выходит из облака и переходит на устройство пользователя.
Полная “эра без токенов” ещё не наступила. Но направление уже ясно: всё больше повседневных задач будет выполняться локально, а облачные модели будут всё сильнее концентрироваться на самых сложных и дорогих сценариях.
Именно поэтому сегодняшний шум вокруг Gemma 4 — это не про один удачный релиз.Это про начало новой конкуренции между облачным и локальным ИИ.
sms_systems@inbox.ru
+ 7 (985) 982-70-55