Karpathy 开源单 GPU 自动炼丹项目
指南2026年3月8日5 分钟阅读
Andrej Karpathy 发布 autoresearch 项目,让 AI 智能体在单 GPU 上自动运行 nanochat 模型训练实验。核心思路是编写 program.md 文件指导智能体,智能体则自主修改 train.py 代码,每轮训练 5 分钟,通过验证损失评估改进,实现夜间无人值守的自动化研究。
本文编译自 autoresearch: AI agents running research on single-GPU nanochat training automatically,版权归原作者所有。
觉得有用?分享给更多人