智能体工程:让 AI 写代码并执行

指南Simon Willison2026年3月15日3 分钟阅读
智能体工程(Agentic Engineering)指的是借助能写代码、执行代码的智能体来开发软件。像 Claude Code、OpenAI Codex 这样的编码智能体,通过循环执行工具来达成目标,让人类开发者能更专注于问题定义和方案选择。

我用 智能体工程(Agentic Engineering) 这个词来描述借助编码智能体开发软件的实践。

什么是 编码智能体(Coding Agents)?它们就是既能写代码又能执行代码的智能体。常见的例子包括 Claude CodeOpenAI CodexGemini CLI

智能体(Agent) 又是什么?明确定义这个词一直是个难题,至少从 1990 年代 起就困扰着 AI 研究者。不过,在 GPT-5、Gemini、Claude 这类大语言模型(LLMs)的领域里,我接受的定义是:

智能体通过循环执行工具来达成目标

你给编码智能体一个目标提示,它就会循环生成并执行代码,直到目标达成。

代码执行能力是智能体工程得以实现的关键。如果不能直接运行代码,LLM 输出的东西价值有限。有了代码执行能力,这些智能体才能开始迭代,最终产出真正能运行的软件。

智能体工程的意义

既然现在有软件能写出可运行的代码,那我们人类还剩下什么可做的?

答案是:太多事情了

写代码从来不是软件工程师的唯一工作。这门手艺的核心一直是搞清楚 该写什么代码。任何一个软件问题都有几十种可能的解决方案,每种都有各自的权衡。我们的工作就是 navigate 这些选项,找到最适合我们特定情况和需求的那个。

从编码智能体那里获得好结果本身就是一门深奥的学问,尤其是在这个领域正以令人眼花缭乱的速度进化的当下。

我们需要为编码智能体提供解决问题所需的工具,用恰当的细节水平描述问题,然后验证并迭代结果,直到我们确信它们能以稳健、可靠的方式解决问题。

LLM 不会从过去的错误中学习,但编码智能体可以——前提是我们有意识地更新指令和工具执行框架(Harness),把一路上学到的东西融入进去。

用好了,编码智能体能让我们在承接项目时更有野心。智能体工程应该能帮我们产出更多、质量更高的代码,解决更有影响力的问题。

关于这份指南

就像它试图涵盖的领域一样,《智能体工程模式》也远未完成。我的目标是识别并描述那些确实能出成果、且不太会因工具进步而过时的工作模式。

我会随着新技术出现,继续添加更多章节。没有哪一章应该被视为最终版。随着我们对这些模式的理解不断深化,我也会更新现有章节。

本文编译自 What is agentic engineering?,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论