CoderForge-Preview:最大开源编码智能体数据集

深度2026年2月25日6 分钟阅读
CoderForge-Preview:最大开源编码智能体数据集
Together 发布迄今最大开源编码智能体轨迹数据集 CoderForge-Preview,包含 25.8 万条测试验证轨迹。基于该数据微调的 Qwen-3 32B 模型在 SWE-Bench Verified 上达到 59.4% pass@1,在 ≤32B 参数开源模型中排名第一。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

苹果为 Safari 推出了内置 MCP 服务器,提供 16 个工具让 AI 代理直接控制浏览器。这是苹果一个月内发布的第二个官方 MCP 服务器,表明 MCP 正成为平台标准基础设施。

深度The New Stack·7月3日·4 分钟

Vercel 首席软件官 Andrew Qu 在访谈中阐述了 Agent 作为一种新软件形态的独特需求,并分享了 Vercel 从构建内部 Agent 到推出框架 eve 的历程。他强调了 Skills 在知识校正、Sandbox 在安全执行中的作用,并预测未来网站需要为 Agent 提供机器可读的界面。

深度Latent Space·7月3日·6 分钟

评论