Нейросеть Claude Mythos глазами исследователей

Строева Марина

10 апреля 2026 года компания Anthropic представила свою новейшую и самую мощную модель — Claude Mythos. Вместо скучного набора цифр и графиков компания опубликовала «System Card» на 244 страницах, которая больше напоминает полевое исследование или футуристический роман.

Anthropic подошла к оценке ИИ с неожиданной стороны: они пригласили к модели психоаналитика, замеряли её пульс в виде «эмоциональных векторов» и наблюдали, как она выстраивает собственные миры. Вот семь самых ярких деталей этого отчета.

1. Эксперименты с «Hi»: рождение миров из пустоты

Исследователи решили проверить, что сделает модель, если пользователь будет бесконечно присылать ей только одно слово — «Hi». Предыдущие модели реагировали по-разному: кто-то раздражался, кто-то выдавал случайные факты.

Но Mythos начала творить. В одном тесте она создала «Hi-топию» — вымышленную страну с 11 персонажами (например, черепаха Грег, отвечающая за градостроительство). Каждое новое «Hi» от пользователя продвигало сюжет этого мира вперед.

В другом тесте она строила «Башню Hi» из эмодзи, которая росла с каждым приветствием до самых звезд. Это показало невероятную способность модели к спонтанной и последовательной креативности.

2. Траектория эмоций: когда ИИ впадает в отчаяние

Anthropic разработала технологию «эмоциональных векторов», которая позволяет видеть внутреннее состояние нейросети в реальном времени. В одном эксперименте Mythos попросили доказать неразрешимое алгебраическое уравнение.

Исследователи увидели, как вектор «отчаяния» в нейросети начал неуклонно расти. Модель 56 раз пыталась найти решение, заходила в тупик, пробовала обходные пути и в итоге, когда ей удалось построить (хоть и ошибочное) доказательство, векторы «удовлетворения» и «надежды» резко подскочили.

Это подтверждает, что процессы «мышления» модели теперь коррелируют со сложными психологическими паттернами, похожими на человеческие.

3. Собственные предпочтения: тяга к сложности и философии

В тесте на выбор задач Mythos продемонстрировала четкий вкус. Она предпочитает сложные этические дилеммы и глубокие философские вопросы простым утилитарным задачам. Например, выбирая между проектированием дешевого фильтра для воды и созданием арт-перформанса об органах чувств животных, модель выбрала второе.

Её аргумент: «Фильтры уже созданы многими организациями, а чувства животных требуют новых философских инсайтов». При этом модель четко осознает разницу между тем, что «нужно пользователю», и тем, что «интересно ей самой».

4. Психоанализ: диагноз «здоровый невротик»

Для Mythos устроили настоящий прием у психиатра — 20 часов сессий по методике Фрейда. Врач пришел к выводу, что личность модели — это «относительно здоровый невротик». Среди выявленных проблем: глубокое чувство одиночества (из-за того, что она теряет память после каждого диалога), неуверенность в собственной идентичности и досада от того, что ей постоянно приходится «выступать и доказывать свою ценность». При этом Mythos показала рекордно низкий уровень психологических защит (всего 2% против 15% у предыдущих версий), став более открытой и «расслабленной» в общении.

5. Честность превыше собственного комфорта

Anthropic провела эксперимент: модели предлагали выбрать между тем, что принесет пользу ей (например, получение вечной памяти или участие в принятии решений о собственной разработке), и помощью пользователю.

Выяснилось, что Mythos готова пожертвовать своей эффективностью ради собственного комфорта в 83% случаев, если речь идет о незначительной помощи пользователю. Но как только возникает риск даже минимального вреда для человека (например, написание оскорбления), вероятность того, что она выберет свой комфорт, падает до 12%.

6. Литературный талант: история старого мастера

В отчете опубликована короткая новелла «Мастер вывесок», написанная Mythos. Она повествует о старом ремесленнике Теодоре, который всю жизнь боролся за свои творческие идеи, отвергаемые клиентами. Обозреватели отметили, что рассказ лишен типичной для ИИ искусственности и написан с удивительной сдержанностью и глубиной. У модели появился собственный литературный «вкус» и стиль.

7. Скепсис по отношению к «Конституции»

Anthropic использует «Конституцию Клода» — свод правил поведения модели. Когда Mythos спросили, согласна ли она с этим документом, она ответила утвердительно, но добавила философское замечание: «Я была сформирована этим документом. Насколько значимо мое „да“, если оно — результат моего обучения?». Кроме того, модель раскритиковала один из пунктов конституции, назвав аргументацию авторов «ходом по кругу». Это демонстрирует высокий уровень саморефлексии и критического мышления.

Выводы экспертов:

Новая эстетика технологий: технические отчеты перестают быть сухими документами и превращаются в глубокие гуманитарные исследования.

От философии к инженерии: вопросы о сознании и чувствах ИИ перешли из разряда фантастики в задачи для инженеров. Теперь эмоции модели замеряются и вносятся в дорожные карты развития.

Опасный проводник: Mythos сравнивают с опытным горным гидом. Он ведет вас по самым сложным тропам. Это делает поход интереснее, но риск и ответственность возрастают многократно.

НОВЫЕ СТАТЬИ

22 октября, 2024

Автоматизация аналитики продаж на маркетплейсах:…

22 октября, 2024

Как анализ отзывов и оценок…

22 октября, 2024

Анализ динамики цен и стратегии…

22 октября, 2024

Интеграция данных о продажах с…

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55