Featherless 推托管 OpenClaw,按需付费终结 AI 智能体隐藏成本

指南The New Stack2026年3月17日3 分钟阅读
Featherless 推托管 OpenClaw,按需付费终结 AI 智能体隐藏成本
Featherless 发布托管版 OpenClaw,一个采用月费制而非按 Token 计费的服务器 AI 智能体平台。该公司称,此举旨在消除基础设施的复杂性和运行自主智能体时不可预测的“隐藏税”。

Featherless 是一家专注于提供服务器平台的公司,通过支持性基础设施提供对开源 AI 模型的 API 访问。概念很简单:开发者可以运行 AI 模型,而无需承担服务器管理责任。该公司周二发布了托管版 OpenClaw,这是一个为开源 AI 智能体提供的托管环境。

这项新服务为开发者提供了一个安全的沙箱运行时环境,并捆绑了推理服务(AI 模型的成本由固定的月订阅费覆盖,而非按 Token 计费)。该公司声称,此举有助于消除基础设施的复杂性和运行自主智能体时不可预测的“隐藏税”。

此次发布标志着 Featherless 所谓的对当前“垄断智能体技术的专有垄断”的直接挑战。

智能体“税收”泡沫如何增长

随着 AI 使用从家庭用户的聊天会话发展到企业级的自主后台任务以运行业务流程,AI 智能体需要浏览网页、执行代码和管理文件结构。

这些行动的总和意味着智能体每天可能消耗数百万个 Token。当智能体服务需要扩展时(由于用户采用率激增,或者智能体决定生成多个子智能体并导致计算递归以处理复杂的推理任务),开发者可能会经历所谓的 Token 焦虑,账单会迅速攀升。其他与 Token 相关的焦虑可能出现在并发智能体从外部 API 调用中获得缓慢或错误结果时;每次恢复循环尝试都会消耗更多 Token。

隐藏的“山姆大叔”税

随着开源自主 AI 智能体 OpenClaw 现在成为全球增长最快的开源智能体项目,智能体领域的“山姆大叔”税吏可能已经在火上浇油。

根据一份贝恩技术报告,智能体工作流每次交互消耗的 Token 是标准聊天的 20-30 倍。Featherless 表示,这很容易导致月账单意外达到数千美元。该公司声称,其托管 OpenClaw 服务的可预测性消除了这种财务风险,并使开发者能够按照自己的条件运行高性能智能体,即使没有大量 DevOps 资源来监督基础设施需求。

安全沙箱化的难题

据报道,OpenClaw 已积累了超过 25 万个 GitHub star 和超过 5 万个 fork,速度超过任何其他软件项目。Featherless 表示,尽管如此,大多数用户仍然难以应对基础设施管理和安全沙箱化的底层复杂性。

就工作机制而言,Featherless 部署了一个安全加固版的 OpenClaw 引擎,由 Daytona 提供支持。Daytona 是一个开源的安全基础设施开发环境管理器工具集。该安全层使用多层容器隔离和为持久性构建的沙箱运行时,与消费级工具中更短暂的会话不同。

托管 OpenClaw 环境 24/7 运行,并得到共享持久存储的支持。智能体可以管理复杂、多天的工作流,这些工作流即使用户关闭浏览器也能保持活动状态且不中断。

“如果开发者不给智能体提供一个标准化、安全且隔离的工作空间,那么我们就像是在一个拥挤的房间里给机器人一把电动工具,而且没有关闭开关。”

Featherless 的联合创始人兼首席执行官 Eugene Cheah 表示,在当前市场上想要运行 OpenClaw 的开发者要么必须屈服于封闭的垄断,要么花数周时间进行 DevOps 来自托管。托管 OpenClaw 被定位为中间地带,为开源生态系统提供一个始终在线且安全的家园。

“一个生产就绪的自托管设置通常要求开发者同时处理至少八个不同的基础设施问题,从容器编排和 GPU 供应到自定义安全沙箱和持久存储。大多数团队最终需要管理五个或更多独立的供应商关系,仅仅是为了保持一个智能体在线。在编写第一行 AI 逻辑之前,这就是一个持续数周的 DevOps 项目,” Cheah 说。

Cheah 表示,他的团队现在已经将这八个障碍合并为一个订阅。通过将加固的计算与集成的推理捆绑在一起,他承诺 Featherless 正在使独立开发者和初创公司能够部署持久、24/7 运行的智能体,真正与最大的实验室竞争,而无需承担基础设施成本或供应商锁定。

给机器人一把电动工具

Daytona 的创始人兼首席执行官 Ivan Burazin 告诉 The New Stack,要让智能体真正有用,它们需要的不仅仅是智能;它们需要一个生活和工作的场所。他说,如果开发者不给智能体提供一个标准化、安全且隔离的工作空间,那么我们就像是在一个拥挤的房间里给机器人一把电动工具,而且没有关闭开关。

虽然人类开发者通常能适应不一致的环境,但 AI 智能体需要绝对的确定性才能运行。Burazin 认为,托管 OpenClaw 正是当今生态系统所需要的:一种抽象掉智能体基础设施巨大 DevOps 负担的方法,以便团队可以专注于构建,而不仅仅是管理运行时。

“大多数人关注的是智能体的智能,但真正的瓶颈是它运行的环境。”

“大多数人关注的是智能体的智能,但真正的瓶颈是它运行的环境。智能体需要一个安全的地方来执行代码、访问文件和安全地运行长期任务。没有那个隔离层,你实际上是在让自主软件直接在生产系统上运行,这是一个巨大的风险。托管 OpenClaw 展示了为什么沙箱基础设施正在成为智能体系统的基础层,它允许开发者运行强大的智能体,而无需自己构建和维护底层运行时,” Burazin 说。

通过此次发布,Featherless 引入了一个计算环境,每个沙箱实例配备 1 个 vCPU 和 2-4 GB RAM,通过 Daytona 进行编排。托管 OpenClaw 将推理直接包含在订阅中,以创建其可预测的计费方案。该服务允许开发者在开源模型之间切换,包括 Qwen 3.5、Minimax M2.5 和 Kimi K2.5,而无需处理按 Token 计费或单独供应商管理的麻烦。未来将提供对超过 30,000 个模型的访问。

本文编译自 Managed OpenClaw bids to kill hidden token tax on AI agents,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论