Что это такое
autoresearch — экспериментальный репозиторий Andrej Karpathy про автоматизацию исследований с помощью AI-агентов. В центре — обучение nanochat на одном GPU и агент, который запускает эксперименты, смотрит на метрики и предлагает следующий шаг.
Проект интересен не как «нажми кнопку и получи науку», а как демонстрация нового рабочего процесса: часть рутинного перебора гипотез, запусков и анализа результатов можно поручить агенту, если вокруг него есть жесткие ограничения и воспроизводимый эксперимент.
Что внутри
Материалы проекта описывают быстрый старт через `uv`, загрузку данных, обучение tokenizer-а, ручной одиночный эксперимент, запуск агента, структуру проекта и принципы проектирования. Это важная деталь: репозиторий показывает не только код, но и то, какие решения автор считает значимыми для такого эксперимента.
Практический сценарий — локально воспроизвести маленькую исследовательскую среду, убедиться, что один эксперимент запускается вручную, а затем дать агенту проводить серию изменений. Такой подход особенно полезен там, где результаты можно быстро измерить и сравнить.
Запуск исследовательского цикла
Команды показывают идею: сначала готовится окружение и данные, потом запускается одиночный эксперимент или агент.
uv sync
uv run python data.py
uv run python train.py
uv run python agent.py
Сильные стороны
Сильная сторона — честная экспериментальность. autoresearch не обещает универсальную платформу, а показывает конкретную лабораторию вокруг nanochat. Это делает проект полезным для людей, которые думают о воспроизводимых AI-исследованиях и автоматизации перебора гипотез.
Ограничения
Ограничение — узкая область и риск переоценки. Агент может запускать эксперименты, но качество научного вывода все равно зависит от постановки задачи, метрик, контроля случайности и человеческой проверки. Финансовые, медицинские или другие прикладные решения нельзя переносить из такого эксперимента напрямую.