用 Claude 微调开源大模型

教程Hugging Face2025年12月4日8 分钟阅读
用 Claude 微调开源大模型
Hugging Face 发布新工具 Hugging Face Skills,让 Claude 等智能体不仅能写训练脚本,还能直接提交任务到云端 GPU、监控进度,并将微调好的模型推送到 Hub。这篇教程展示了完整工作流,从安装配置到实际训练,支持 SFT、DPO、GRPO 等多种生产级方法。
本文编译自 We Got Claude to Fine-Tune an Open Source LLM,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

作者基于 LLM 库构建了一个简单的编码 Agent,实现了文件编辑、命令执行、文件搜索等工具,并通过 CLI 和 Python API 提供交互。实验展示了 Agent 自动生成代码的能力。

教程Simon Willison·7月2日·4 分钟

使用 DSPy 框架评估和优化 Datasette Agent 的 SQL 回答系统提示词。方法包括构建测试框架、生成自动评估数据集、运行优化循环,并发现了多个改进方向。

教程Simon Willison·7月2日·3 分钟

评论