Команда Калифорнийского университета в Сан-Диего представила AIBuildAI — многоагентную систему, которая умеет по обычному текстовому описанию задачи полностью автоматически проектировать, писать, обучать, настраивать и улучшать AI-модели.
В этой схеме человеку не нужно писать код вручную: достаточно сформулировать цель, а дальше система сама разбирает задачу на этапы и проходит весь цикл разработки.
Это уже не просто AI-помощник для программиста. Это попытка сделать так, чтобы AI строил AI — то есть одна модель или группа агентов выступала бы в роли виртуальной команды инженеров и исследователей.
Что умеет AIBuildAI
Система закрывает весь стандартный пайплайн разработки модели:
проектирует архитектуру;
пишет и запускает код;
обучает модель;
подбирает гиперпараметры;
оценивает качество;
запускает итерации улучшения.
Идея в том, чтобы заменить не одну отдельную операцию, а целую исследовательско-инженерную цепочку. Это особенно важно, потому что в реальной AI-разработке самые трудозатратные этапы — не только написание кода, но и постоянные эксперименты, отладка, сравнение вариантов и контроль качества.
Как устроена система
AIBuildAI работает как многоагентная команда, где у каждого агента своя функция:
Manager Agent — координирует весь процесс, решает, какой агент должен работать дальше, и отсеивает слабые варианты;
Designer Agent — придумывает архитектуры и предлагает новые стратегии;
Coder Agent — превращает идеи в рабочий код и запускает базовую проверку;
Tuner Agent — занимается обучением и донастройкой, чтобы выжать максимум производительности.
Такой подход очень похож на реальную работу AI-лаборатории: один человек не пишет всё сам, а управляет командой с разными ролями. Только здесь эту команду частично заменяют агенты.
Ключевой смысл AIBuildAI в том, что он делает AI-разработку менее зависимой от ручного труда. В обычной ситуации создание хорошей модели требует:
сильной экспертизы,
множества повторных экспериментов,
долгих циклов подбора параметров,
большого количества времени и денег.
AIBuildAI переводит это в более автоматизированный формат. Пользователь не обязан быть инженером-ML, чтобы запустить полноценный исследовательский цикл. Это может резко расширить круг людей, способных работать с AI-разработкой.
Самое громкое в этой истории — результат на OpenAI MLE-Bench. AIBuildAI показал 63,1% побед и занял первое место среди систем на наборе из 75 задач. Это сильный сигнал: архитектура реально работает не только в теории, но и на сложных практических бенчмарках, где нужно пройти путь от сырых данных до готовой модели.
Особенно важно, что MLE-Bench — это не синтетическая игрушка, а набор задач, близких к настоящим Kaggle-челленджам. Там есть:
классификация изображений,
детекция и сегментация,
NLP-задачи,
временные ряды,
табличное прогнозирование.
То есть AIBuildAI проявил себя в довольно широком наборе сценариев, а не только в одной узкой зоне.
AIBuildAI — это не просто ещё один генератор кода. Главная разница в том, что система умеет работать с динамикой обучения:
отслеживать, как идёт тренировка;
понимать, когда стоит остановиться;
решать, нужно ли менять гиперпараметры;
переключаться между вариантами.
Это очень близко к тому, как думает реальная команда ML-инженеров. Именно поэтому система выглядит как шаг от «AI пишет код» к «AI ведёт проект».
Если такие системы продолжат развиваться, то барьер входа в AI-разработку станет ещё ниже. Это означает:
больше людей смогут запускать AI-проекты без глубокой инженерной подготовки;
часть рутинной ML-работы будет автоматизирована;
ценность сместится от ручного исполнения к постановке задачи, выбору целей и оценке результата.
В долгосрочной перспективе это очень похоже на то, о чём сейчас говорят во многих AI-историях: AI начинает не только пользоваться инструментами, но и сам строить инструменты для себя.
AIBuildAI — это ещё один знак того, что мы переходим от AI как помощника к AI как самоорганизующейся инженерной системе. Если раньше модели помогали писать код, то теперь они начинают помогать создавать другие модели.
Это уже не просто автоматизация. Это попытка построить замкнутый цикл, в котором AI всё меньше зависит от ручного вмешательства человека. И победа на MLE-Bench показывает, что эта идея уже не выглядит фантастикой.
sms_systems@inbox.ru
+ 7 (985) 982-70-55