智能体工程:让 AI 写代码并执行
我用 智能体工程(Agentic Engineering) 这个词来描述借助编码智能体开发软件的实践。
什么是 编码智能体(Coding Agents)?它们就是既能写代码又能执行代码的智能体。常见的例子包括 Claude Code、OpenAI Codex 和 Gemini CLI。
那 智能体(Agent) 又是什么?明确定义这个词一直是个难题,至少从 1990 年代 起就困扰着 AI 研究者。不过,在 GPT-5、Gemini、Claude 这类大语言模型(LLMs)的领域里,我接受的定义是:
智能体通过循环执行工具来达成目标
你给编码智能体一个目标提示,它就会循环生成并执行代码,直到目标达成。
代码执行能力是智能体工程得以实现的关键。如果不能直接运行代码,LLM 输出的东西价值有限。有了代码执行能力,这些智能体才能开始迭代,最终产出真正能运行的软件。
智能体工程的意义
既然现在有软件能写出可运行的代码,那我们人类还剩下什么可做的?
答案是:太多事情了。
写代码从来不是软件工程师的唯一工作。这门手艺的核心一直是搞清楚 该写什么代码。任何一个软件问题都有几十种可能的解决方案,每种都有各自的权衡。我们的工作就是 navigate 这些选项,找到最适合我们特定情况和需求的那个。
从编码智能体那里获得好结果本身就是一门深奥的学问,尤其是在这个领域正以令人眼花缭乱的速度进化的当下。
我们需要为编码智能体提供解决问题所需的工具,用恰当的细节水平描述问题,然后验证并迭代结果,直到我们确信它们能以稳健、可靠的方式解决问题。
LLM 不会从过去的错误中学习,但编码智能体可以——前提是我们有意识地更新指令和工具执行框架(Harness),把一路上学到的东西融入进去。
用好了,编码智能体能让我们在承接项目时更有野心。智能体工程应该能帮我们产出更多、质量更高的代码,解决更有影响力的问题。
关于这份指南
就像它试图涵盖的领域一样,《智能体工程模式》也远未完成。我的目标是识别并描述那些确实能出成果、且不太会因工具进步而过时的工作模式。
我会随着新技术出现,继续添加更多章节。没有哪一章应该被视为最终版。随着我们对这些模式的理解不断深化,我也会更新现有章节。
觉得有用?分享给更多人