CoderForge-Preview：最大开源编码智能体数据集

深度2026年2月25日6 分钟阅读

Together 发布迄今最大开源编码智能体轨迹数据集 CoderForge-Preview，包含 25.8 万条测试验证轨迹。基于该数据微调的 Qwen-3 32B 模型在 SWE-Bench Verified 上达到 59.4% pass@1，在 ≤32B 参数开源模型中排名第一。

本文编译自 CoderForge-Preview: SOTA open dataset for training efficient coding agents，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

概念速查

AI 智能体

AI Agent 是能自主感知环境、制定计划并采取行动来完成目标的智能程序——不只是聊天，而是帮你干活。

Safari 变成 AI 代理可操控的浏览器

苹果为 Safari 推出了内置 MCP 服务器，提供 16 个工具让 AI 代理直接控制浏览器。这是苹果一个月内发布的第二个官方 MCP 服务器，表明 MCP 正成为平台标准基础设施。

深度The New Stack·7月3日·4 分钟

Vercel 首席软件官谈 Agent：一种新形态的软件

Vercel 首席软件官 Andrew Qu 在访谈中阐述了 Agent 作为一种新软件形态的独特需求，并分享了 Vercel 从构建内部 Agent 到推出框架 eve 的历程。他强调了 Skills 在知识校正、Sandbox 在安全执行中的作用，并预测未来网站需要为 Agent 提供机器可读的界面。

深度Latent Space·7月3日·6 分钟

CoderForge-Preview：最大开源编码智能体数据集

概念速查

相关文章

Safari 变成 AI 代理可操控的浏览器

Vercel 首席软件官谈 Agent：一种新形态的软件

评论