ИИ-агенты Anthropic Claude написали компилятор языка Си: новый этап в развитии искусственного интеллекта


Компания Anthropic провела уникальный эксперимент, в ходе которого 16 ИИ-агентов совместно разработали компилятор языка Си с нуля. Этот проект демонстрирует новые возможности современных систем искусственного интеллекта, хотя результат пока далёк от совершенства. В статье мы разберём, как проходил эксперимент, какие проблемы возникли и что это значит для будущего ИИ-программирования.

Как проходил эксперимент
Подготовка и запуск
Эксперимент возглавил исследователь Николас Карлини, который запустил 16 экземпляров модели Claude Opus 4.6 в облачной среде. Каждый агент работал в отдельном контейнере Docker и имел доступ к общей кодовой базе через Git.

Самоорганизация агентов
В отличие от традиционных подходов, центрального координатора не было. Каждый ИИ-агент самостоятельно выбирал задачи, решал их и отправлял результаты обратно в репозиторий. При возникновении конфликтов слияния агенты успешно их устраняли без вмешательства человека.

Результаты
За две недели и 2000 сессий работы был создан компилятор на языке Rust объёмом 100 000 строк кода. Он способен компилировать ядро Linux 6.19 для архитектур x86, Arm и RISC-V, а также проходит 99 % тестов GCC.

Ограничения проекта
Недостатки компилятора
Несмотря на успехи, компилятор имеет серьёзные ограничения:
— Не поддерживает 16-битный машинный код для Linux.
— Ассемблер и линкер работают со сбоями.
— Генерируемый код менее эффективен, чем у GCC.

Проблемы масштабирования
*«Кодовая база разрастается до такой степени, что ни один участник проекта не может её полностью понять»*, — отмечает автор эксперимента. Пределом стало достижение 100 000 строк кода, после чего добавление новых функций стало невозможным без нарушения существующих.

Технические сложности и решения
Оптимизация тестирования
Многословные запросы тестов перегружали контекстное окно модели, что приводило к потере фокуса. Для решения этой проблемы были разработаны средства запуска тестов с выводом только ключевых строк сводки.

Управление временем выполнения
Claude не имеет чувства времени и мог часами выполнять тесты без прогресса. Чтобы избежать этого, исследователь внедрил быстрый режим обработки 1–10 % тестовых случаев.

Значение эксперимента для будущего ИИ
Проект стал важным шагом в развитии ИИ-программирования:
1. Параллельная работа агентов: Механизм координации через Git открывает новые возможности для групповой работы ИИ.
2. Инженерные приёмы: Разработанные методы оптимизации могут быть применены в других проектах.
3. Прогресс за год: Всего год назад ни одна языковая модель не могла справиться с подобной задачей даже при неограниченных ресурсах.

*«Этот эксперимент показывает, что автономные ИИ-агенты способны решать сложные задачи, хотя пока и с ограничениями»*, — подчеркивает Карлини.

Итог: Эксперимент Anthropic демонстрирует потенциал ИИ в разработке программного обеспечения, но также напоминает о технических вызовах, которые ещё предстоит преодолеть. Это важный шаг на пути к более автономным и эффективным системам искусственного интеллекта.

PDA-news.ru