autoresearch — open source проект на GitHub

autoresearch — эксперимент Andrej Karpathy с AI-агентами, которые автоматически проводят исследования вокруг обучения nanochat на одном GPU.

Что это такое

autoresearch — экспериментальный репозиторий Andrej Karpathy про автоматизацию исследований с помощью AI-агентов. В центре — обучение nanochat на одном GPU и агент, который запускает эксперименты, смотрит на метрики и предлагает следующий шаг.

Проект интересен не как «нажми кнопку и получи науку», а как демонстрация нового рабочего процесса: часть рутинного перебора гипотез, запусков и анализа результатов можно поручить агенту, если вокруг него есть жесткие ограничения и воспроизводимый эксперимент.

Что внутри

Материалы проекта описывают быстрый старт через `uv`, загрузку данных, обучение tokenizer-а, ручной одиночный эксперимент, запуск агента, структуру проекта и принципы проектирования. Это важная деталь: репозиторий показывает не только код, но и то, какие решения автор считает значимыми для такого эксперимента.

Практический сценарий — локально воспроизвести маленькую исследовательскую среду, убедиться, что один эксперимент запускается вручную, а затем дать агенту проводить серию изменений. Такой подход особенно полезен там, где результаты можно быстро измерить и сравнить.

Запуск исследовательского цикла

Команды показывают идею: сначала готовится окружение и данные, потом запускается одиночный эксперимент или агент.

Язык: Bash

uv sync
uv run python data.py
uv run python train.py
uv run python agent.py

Сильные стороны

Сильная сторона — честная экспериментальность. autoresearch не обещает универсальную платформу, а показывает конкретную лабораторию вокруг nanochat. Это делает проект полезным для людей, которые думают о воспроизводимых AI-исследованиях и автоматизации перебора гипотез.

Ограничения

Ограничение — узкая область и риск переоценки. Агент может запускать эксперименты, но качество научного вывода все равно зависит от постановки задачи, метрик, контроля случайности и человеческой проверки. Финансовые, медицинские или другие прикладные решения нельзя переносить из такого эксперимента напрямую.