Anthropic выпустила самый мощный и одновременно самый дорогой ИИ-модель — Claude Mythos. Стоимость обработки токенов в ней достигает $25 за миллион входных и $125 за миллион выходных токенов, что почти в 8 раз дороже предыдущей версии Claude Sonnet 4.6 ($3/$15).
При этом Mythos пока недоступен для обычных пользователей — Anthropic сама не решила, как его правильно применять. Это символизирует новую эпоху: модели становятся умнее, а стоимость общения с ИИ растет. Пользователи ищут способы экономии.
Некоторые предлагают общаться с ИИ на классическом китайском (文言文) — языке сжатом и лаконичном. Однако эксперименты показали, что это не снижает расход токенов, так как модели кодируют не по длине текста, а по смыслу и частоте слов.
Более эффективным оказался проект Caveman — «язык пещерного человека». Он предлагает специальный навык, который заставляет модель избегать пустых фраз, сокращать артикли и неясные выражения, сохраняя при этом точность и полноту технических данных.
Использование Caveman позволяет сократить расход токенов на 65% при сохранении 100% точности вывода. Кроме того, проект предлагает инструмент для сжатия входных данных, уменьшая количество токенов, необходимых для чтения контекста, примерно на 45%.
Исследование «Brevity Constraints Reverse Performance Hierarchies in Language Models» показало, что принудительное сокращение ответов ИИ не снижает, а наоборот повышает точность на 26%. Аналогично, метод «Chain of Draft» от Zoom предлагает замену длинных рассуждений краткими «черновиками», что снижает вычислительные затраты без потери качества.
10 практических советов по экономии токенов
Редактируйте уже отправленные сообщения, а не отправляйте новые. Каждое новое сообщение заставляет модель перечитывать всю историю.
Начинайте новый диалог каждые 15–20 сообщений. Длинные диалоги сильно расходуют токены на повторное чтение контекста.
Объединяйте вопросы в одном сообщении. Это снижает количество загрузок контекста и повышает качество ответов.
Загружайте повторяющиеся документы в проекты (Projects). Файлы кэшируются и не расходуют токены при повторных запросах.
Настраивайте память и пользовательские предпочтения заранее. Это экономит токены на повторное объяснение контекста.
Отключайте ненужные функции, например, веб-поиск и продвинутые размышления.
Используйте разные модели для разных задач. Простые задачи — дешевые модели, сложные — мощные.
Распределяйте работу по времени. Лимиты считаются по скользящему окну, а не по календарному дню.
Избегайте пиковых часов. В это время расход токенов выше.
Включайте функцию «Extra Usage» для страховки от внезапного исчерпания лимита.
От эпохи платных SMS до эпохи платных токенов — суть остается прежней: экономия и эффективность коммуникации важнее объема. Использование «языка пещерного человека» и других техник сокращения — это не просто шутка, а необходимый навык в мире, где каждый токен стоит как золото.
sms_systems@inbox.ru
+ 7 (985) 982-70-55