S
SkillNav

6人团队 Stably 如何把 AI 测试 Agent 交付周期从数周压缩到数小时

资讯2026-02-17T13:00:00+00:008 分钟阅读
6人团队 Stably 如何把 AI 测试 Agent 交付周期从数周压缩到数小时

5 分钟阅读

2026 年 2 月 17 日

一家 6 人初创公司发现,他们的瓶颈并不是 AI,而是“基础设施焦虑”。随后,他们赢得了 Vercel 的 AI Accelerator。

Stably 这支 6 人团队借助 Vercel,更快交付 AI 测试 Agent——把周期从数周缩短到数小时。他们的转变凸显了 Vercel 平台如何消除基础设施焦虑、提升自主测试能力,并推动企业业务快速增长。

Stably 联合创始人兼 CEO Jinjing Liang 当时在做一件技术上颇具野心的事:构建可自主执行端到端测试的 AI Agent。它们会部署到预览 URL、读取代码 diff,并验证变更是否真的生效。测试是自主编码的关键瓶颈:AI 写代码很快,但如果缺少验证,团队就会被迫手动逐项检查。

但 Stably 自己也有瓶颈。每新增一个功能,就要做基础设施决策;每新增一个 Agent,就会产生部署焦虑。对于一个只有 6 个人的团队来说,这样的 DevOps 开销难以持续。

Link to heading关键成果一览

  • 发布 新产品线从数周缩短到数小时

  • 交付 内部工具(Slack bots、dashboards)时无需担心部署

  • 扩展 从早期产品到企业合同,沿用同一套基础设施

  • 全栈 由 6 人团队运转,在保持精简的同时实现营收

Vercel meeting with the Stably team

Vercel 与 Stably 团队会面

Link to heading基础设施“税”

“Stably 是一个 AI 端到端测试框架,可直接与 Claude Code 这类 coding agent 集成,”Jinjing 解释道。“我们测试的是实际应用,会像真实用户一样点击操作。你的 Agent 可以调用 Stably 验证自己的工作,因此你可以并行运行它们,并规模化交付高质量功能。”

在创立 Stably 之前,Jinjing 曾在 Google Chrome 团队做基础设施,她的联合创始人 Neil 则在 Uber 安全团队工作。两人都拥有交付高可靠系统的经验,知道小故障也可能带来巨大影响。这段经历也影响了他们打造 Stably 的方式:即便团队规模小,可靠性依然是底线要求。他们已经有营收,但团队运作精简,尽可能使用 AI 工具,不可能把工程资源浪费在 DevOps 上。

他们的前端和后端都运行在 Vercel 上,利用 AI Gateway 实现 AI 可扩展性和更高 TPM 限额,并通过 Sandbox 执行 agentic code。

Jinjing 的团队对技术栈中每个环节都做了深入的供应商评估。但 Vercel 总是胜出。每次比较替代方案,结论都一样:更好的开发者体验、更少的 bug、更少的限制、更快的功能迭代。

结果总是如此:Vercel 的开发者体验最好,bug 更少,限制更少,而且我们看到他们新增功能的速度越来越快。

Jinjing Liang, CEO

她的理念很简单:“除非你有充分理由,否则就应该信任社区。你的默认思路应该是:我要先说明为什么不该构建在 Vercel 上。”

Link to heading文化转变

当基础设施不再是决策障碍后,团队发生了一个意想不到的变化:整个运作节奏都变了。

“我们以前常说,if you see something, say something(看到问题就提出来),”Jinjing 回忆道,“但现在我们改成了:if you see something, just do it(看到机会就直接做)。”

工程师不再纠结“部署会不会卡住”,产品想法也能在当天落地为已上线功能。很多原本会被归为“以后再做”的内部工具,现在几小时就能做出来。

Stably 在同一套 Vercel 技术栈上构建了可搜索数据库并回答问题的 Slack bots、dashboards 以及新 Agent。她说:“我们不再害怕发布新产品,因为我们知道部署不会成为瓶颈。”

团队甚至构建了可自主部署整套服务的内部 AI Agent。“有人会说,‘我真想加一个新产品’,然后就直接去做。DevOps 全都能搞定,不再困难。你甚至可以直接问我们的 Slack bot——它完全跑在 Vercel 上——这个 bot 会进去帮你把所有东西搭好,然后给你提一个 PR。”

Link to heading通过 Vercel Accelerator 加速

5 个月前,Stably 申请 Vercel AI Accelerator 时,公司正处于转折点。他们已经迭代了数年。最早一段时间主要是与用户交流、理解问题,并构建了一个把测试当作“事后步骤”的产品版本——即把测试作为开发流水线末端附加流程。

但在申请前不久,他们意识到:真正的突破在于把测试直接嵌入开发者工作流。他们先做出新产品的初始版本,拿到早期反馈,再趁势申请加速器。

进入项目后,相关课程同时塑造了他们对产品和业务的思考。在与 Vercel、MongoDB、HubSpot 同场的炉边谈话中,Jinjing 对定价策略获得了更清晰的认知。有一场分享给了她一个深刻洞见:“定价就是产品的一部分(pricing is product)。”

“以前我把定价这块交给一位实习生,”她坦言,“但那之后,我会亲自审查整个定价模块。现在团队里我对定价代码的了解比任何人都多。这让我意识到其中需要投入多少思考。”

准备加入今年的 Vercel Accelerator 吗? 申请通道 现已开启,截止至 2 月 16 日。

赢得加速器(以及随之而来的 Vercel Ventures 投资)后,Stably 的发展轨迹发生了超越资金层面的变化。品牌背书在企业销售沟通中打开了更多大门。“很多次客户会说,‘你们是 Vercel 投的,对吧?这是个很强的信号。’这强化了我们原本就在做的事情,也让企业买方更有信心。”

他们在 LinkedIn 发布赢得加速器的公告后,收到了多个 inbound leads,其中一些目前已进入签约阶段。

自加速器之后,Stably 的变化主要体现在两方面。“第一,”Jinjing 说,“我们开始把更多核心产品能力和内部工具开源。我们在沿着 Vercel 的打法走:Next.js、Turborepo,一边做业务,一边用开放工具赋能开发者。这种开源精神正是我们最初被 Vercel 吸引的原因。第二,真实的营收增长。通过加速器获得的企业试点,正在转化为正式合同。”

Link to heading基础设施应有的样子

对 Stably 来说,基础设施从来不该是主角,产品才是。Vercel 只是确保基础设施不挡路。

这种专注正在带来回报。一个 6 人、精简且已有营收的团队,如今正在把企业试点转为合同,准备开源他们的测试框架,并把新产品线发布周期从数周压缩到数小时。

那句起初只是内部文化转变的口号——if you see something, just do it——已经成为整个公司的运行原则。

**关于 Stably:**Stably 构建 AI 驱动的端到端测试,并直接集成进开发者工作流,使 coding agents 能够大规模验证自身工作成果。

原文链接:https://vercel.com/blog/How-Stably-ships-AI-testing-agents-in-hours-not-weeks

相关文章

AINews:Harness Engineering 到底是不是一门真学问?
深度·3月5日
AINews:Harness Engineering 到底是不是一门真学问?

这篇文章围绕 AI 工程中的核心争议展开:系统能力究竟主要来自更强的模型(Big Model),还是来自更强的编排层(Big Harness)。文中汇总了 OpenAI、Anthropic、Scale AI、METR 等多方观点与数据,显示两派在“模型进步会不会吞噬 Harness 价值”上分歧明显。作者最终认为,随着 Agent 产品落地加速,Harness Engineering 的独立价值正在被市场和社区进一步确认。

10 分钟
每个 Agent 都需要一个 Box:Aaron Levie 谈 AI 时代的新基础设施
深度·3月5日
每个 Agent 都需要一个 Box:Aaron Levie 谈 AI 时代的新基础设施

在围绕“AI 是否正在杀死 SaaS”的争论中,Box CEO Aaron Levie 提出相反观点:企业内容与文件系统在 Agent 时代反而更关键。随着 Filesystem、Sandbox 和 Agent 工作流快速普及,核心问题从“让 Agent 能做事”转向“如何治理 Agent 的身份、权限与安全边界”。他认为,未来企业将拥有远多于人的 Agent 数量,而真正的竞争力在于率先完成面向 Agent 的组织与基础设施改造。

8 分钟