Cursor 云智能体开启软件开发第三时代

深度Latent Space2026年3月6日4 分钟阅读
Cursor 云智能体开启软件开发第三时代
Cursor 的云智能体(Cloud Agents)使用量已超越其传统的 VSCode 分支 IDE,标志着软件开发进入‘第三时代’。新功能让智能体能在完整虚拟机中运行、测试代码并生成演示视频,显著提升了开发工作流。

本文为长文精华摘要,完整内容请查看原文。

云智能体成为主流,IDE 时代终结

硅谷的普遍共识是“IDE 已死”。数据证实,即使在作为“VSCode 分支”典范的 Cursor 公司内部,人们使用智能体(Agents)的频次也已正式超过了标签页自动补全(第一波 AI 编程浪潮)。

Cursor 云智能体已推出数月,本次发布的核心是“计算机使用”(Computer Use)能力。这标志着 Cursor 进入了其“第三时代”,云智能体超越了其历史上作为“VSCode 分支”IDE 的用例。

云智能体的三大支柱

1. 智能体自主测试 云智能体现在不仅编写代码,还会在独立的云端计算机上运行和测试其更改。这意味着智能体可以启动开发服务器,迭代修改,最终提交的是一个“已测试的 PR”,而不仅仅是“尝试了一些东西的 PR”。默认情况下,智能体会根据变更复杂度判断是否需要测试,用户也可以通过 /no-test 命令或 agents.md 文件进行配置。

2. 生成演示视频 在智能体能端到端编写更多代码的新世界里,代码审查成了新的瓶颈。审查视频虽然不是代码审查的替代品,但提供了一个比浏览巨大差异文件更轻松的切入点。智能体完成任务后,会生成一个展示其实现效果的视频,有时甚至会构建类似 Storybook 的组件库来演示。

3. 完全远程控制 用户拥有对智能体所用虚拟机的完全远程控制(VNC)权限,包括界面和终端。这允许用户直接与预览交互、调试,获得实时体验,这是静态视频无法替代的。

工作流变革:从标签页到团队协作

云智能体支持完整的端到端功能开发,从前端到后端。例如,它可以为实现一个更好的错误提示消息而工作:打开开发者工具,编写 JS 代码来模拟输入超长字符,测试并验证新错误消息的显示。

这种能力使得工作流从“一人一模型”加速,转变为“拓宽管道”——通过并行智能体或智能体群(Swarms of Agents)在相同时间内完成更多工作。

智能体工程的前沿思考

子智能体与上下文管理 讨论涉及了子智能体(Subagents)和上下文管理。未来,智能体可能需要管理自己的上下文,甚至编辑自己的系统提示(System Prompt),但这需要安全地进行,目前更多处于研究范畴。

智能体的自我意识与记忆 记忆(Memory)被视为智能体自我审计(Self-Audit)能力和自我意识(Self-Awareness)的子集。智能体需要了解其运行环境的约束,并能够识别自身功能缺口,通过动态文件系统(如创建注释、链接文件)等方式来填补。这种“自我意识”并非指模型的意识,而是指其优化自身在特定系统中运行的能力。

模型选择与自动路由 实验发现,在智能体流程的底层使用不同模型提供商的基础模型,可以产生协同效应,输出结果优于使用单一统一的基础模型层。

本文编译自 Cursor's Third Era: Cloud Agents,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Simon Willison 正在重构 LLM Python 库的抽象层,以支持服务器端工具执行等新功能。他利用 Claude Code 分析了四大 LLM 提供商的客户端库,生成了用于测试的 curl 命令和 JSON 输出。这些调研材料已开源,旨在帮助设计更通用的 API 抽象。

深度Simon Willison·4月5日·1 分钟

智能体技能——包含程序性知识和可执行资源的结构化包,供智能体在推理时动态加载——已成为增强 LLM 智能体的可靠机制。然而,推理时技能增强存在根本性限制:检索噪声引入无关指导,注入的技能内容带来大量 token 开销,而模型从未真正习得它所遵循的知识。我们提出一个问题:技能是否可以被内化到模型参数中,使其在无需任何运行时技能检索的情况下实现零样本自主行为?我们提出 Skill0,一个专为技能内化设计的上下文强化学习框架。Skill0 引入了一种训练时课程,从提供完整技能上下文开始,逐步撤除。技能按类别离线分组,并与交互历史一起渲染为紧凑的视觉上下文,教授模型工具调用和多轮任务完成。动态课程机制…

深度·4月5日·17 分钟

评论