Как ИИ за двое суток переворачивает 20 лет исследовательской практики

Как ИИ за двое суток переворачивает 20 лет исследовательской практики
 

Бывший директор по AI в Tesla и один из основателей OpenAI Анджей Карпати опубликовал открытый проект autoresearch — минималистичный, но рабочий фреймворк, в котором автономный AIагент круглосуточно и самостоятельно проводит эксперименты по улучшению моделей.

Проект взорвал сообщество: репозиторий уже собрал десятки тысяч звёзд и тысячи наблюдателей, а первые результаты заставляют поновому смотреть на роль человека в научной работе.

Что такое autoresearch и как он устроен

Autoresearch — это компактный Pythonрепозиторий (~630 строк кода), спроектированный так, чтобы AIагент мог:

модифицировать единственный файл train.py (архитектура модели, гиперпараметры, оптимизатор и тренировочный цикл);

запускать короткие тренировки фиксированной продолжительности (по умолчанию 5 минут);

автоматически оценивать изменения по метрике val_bpb (валидационный битнабайт);

сохранять улучшения и откатывать неудачные варианты.

Важные компоненты:

prepare.py — неизменяемая часть: загрузка данных, подготовка токенизатора, утилиты и функции оценки;

train.py — единственный файл, доступный агенту для правок;

program.md — человек пишет контекст и инструкции в Markdown, агент исполняет их как «исследовательскую задачу».

Фиксированное время тренировки (5 минут) обеспечивает прямую сравнимость экспериментов: около 12 запусков в час, ~100 запусков за ночь. Это позволяет агенту быстро пробовать большое число модификаций и выявлять действительно работающие идеи на конкретном оборудовании (пока поддерживается одна NVIDIA GPU).

Первые результаты — двухдневный эксперимент и прирост эффективности

В опубликованном примере Karpathy запустил autoresearch на упрощённой модели nanoChat (глубина 12) и дал агенту поработать около двух суток. Итоги:

проведено 276 экспериментов;

отобрано 29 рабочих улучшений;

совокупное улучшение эффективности тренировки — примерно +11% (время «достичь уровня GPT2» сократилось с ~2.02 ч до ~1.80 ч).

Позже Карпати упомянул, что агент в сумме сделал порядка 700 попыток изменений, а сообщество уже расширило опыт — в фанатских ветках запустили ~3000 экспериментов и зафиксировали ≈82 полезные правки.

Исходный репозиторий: karpathy/autoresearch. Карпати также публиковал итерации и наблюдения в своих постах в X (Twitter): пост 1, пост 2.

Почему это важно — от «наблюдения за процессом» к «освобождению исследователя»

Karpathy описывает цель проекта предельно просто: создать агента, который сможет непрерывно продвигать исследование без человеческого вмешательства. В его словах — и вызов, и обещание: если агент может самостоятельно придумывать, тестировать и валидировать улучшения, то базовая рутина (запуск сотен экспериментов, мелкие гиперпараметрические правки) может быть полностью автоматизирована. Это меняет привычные роли в лаборатории:

аспиранты и инженеры смогут меньше времени тратить на «присмотр за тренировками» и больше — на формулировку идей, анализ и концептуальную работу;

ускоряются итерации и обнаружение локально эффективных решений для конкретного железа.

Karpathy идёт дальше и предлагает видение «агрегированного научного сообщества из агентов» — множество автономных агентов, действующих асинхронно, обменивающихся результатами и совместно генерирующих идеи, подобно распределённой сети исследователей.

Autoresearch — не замена учёному, а мощный инструмент: «помощникскорострел», способный в короткое время перебрать сотни гипотез. Следующие шаги, по замыслу автора и сообщества, — сделать агенты более кооперативными, добавлять асинхронную многомашинную координацию, расширять набор метрик и обеспечить надёжность/контроль качества предложений агента.

В перспективе такие инструменты могут стать стандартной частью лабораторного пайплайна: агент ищет быстрые эмпирические выигрыши на малых моделях, люди переводят лучшие идеи на большие модели и формируют научные обоснования.

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55

Если у вас есть инновационная идея, мы будем рады реализовать ее для Вас!

Специалисты нашей кампании и наши разработки для вас!