红/绿 TDD:智能体工程模式

指南Simon Willison2026年3月16日2 分钟阅读
用红/绿 TDD 模式指导 AI 编程智能体,能显著提升代码质量和测试覆盖率。这种测试驱动开发方法先写失败测试,再实现代码,有效避免智能体写出无用或错误的代码。

用红/绿 TDD 模式指导 AI 编程智能体,能显著提升代码质量和测试覆盖率。这种测试驱动开发方法先写失败测试,再实现代码,有效避免智能体写出无用或错误的代码。

什么是红/绿 TDD?

红/绿 TDD 是测试驱动开发(Test Driven Development)的一种简洁表达。TDD 是一种编程风格,要求每段代码都配有自动化测试,以证明代码正常工作。

最严格的 TDD 形式是测试优先开发:先写自动化测试,确认测试失败,然后迭代实现直到测试通过。

为什么适合智能体工程?

这种方法特别适合编码智能体(Coding Agent)。使用智能体时,常见风险包括写出不工作的代码,或构建了从未用到的冗余代码。

测试优先开发能有效防范这两类错误,同时确保建立健壮的自动化测试套件,防止未来回归问题。随着项目增长,新改动破坏现有功能的风险也随之增加,全面的测试套件是保持功能稳定的最佳方式。

关键步骤:先红后绿

在实现代码前,必须确认测试失败。如果跳过这一步,可能写出原本就通过的测试,从而无法验证新实现。

这就是红/绿的含义:红阶段观察测试失败,绿阶段确认测试通过。

好的大语言模型都理解红/绿 TDD 这个简写,它代表更长的指令:使用测试驱动开发,先写测试,在实现改动前确认测试失败,然后让测试通过。

示例提示(Example prompt):

code
Use red/green TDD
本文编译自 Red/green TDD - Agentic Engineering Patterns,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论