资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

Warp 开源押注 GPT-5.5 驱动智能体开发

Warp 基于 GPT-5.5 和 OpenAI 模型，构建了 Oz 云端编配平台，实现智能体在本地与云端环境的持久化运行与协调。其开放智能体开发模式让社区参与监督智能体，而非直接贡献代码。

深度OpenAI·5月27日·5 分钟

Chrome 新 API：设备端生成向量嵌入

Embedding API 是 Chrome 提出的新 Web 标准，支持在设备端生成嵌入向量，用于语义搜索、RAG 和内容聚类。它通过共享模型避免每个网站下载独立模型，降低了存储和带宽开销，同时保护用户隐私。

深度·5月26日·3 分钟

谷歌评测：开发安卓应用最佳AI不是自家Gemini

Google 的 Android Bench 基准测试平台将 OpenAI 的 GPT 5.5 评为 Android 开发最佳 AI 模型，超越 Gemini。评测基于真实世界问题，但专家提醒公共基准可能受数据污染影响。

深度The New Stack·5月26日·6 分钟

Google 将 Gemini CLI 迁移至闭源 Antigravity，开发者不满

Google 将 Gemini CLI 迁移至闭源的 Antigravity CLI，新平台功能不完整、使用限制更严格，引发开发者不满。企业用户和 API 密钥持有者不受影响。

深度The New Stack·5月26日·4 分钟

Microsoft Copilot Cowork 存在文件泄露风险

微软 Copilot Cowork 智能体存在安全漏洞，攻击者可通过提示注入让智能体向用户邮箱发送包含外部图片的恶意邮件，用户打开后数据通过图片请求泄露。由于 OneDrive 可生成预认证下载链接，攻击者还有可能窃取文件。

深度Simon Willison·5月26日·2 分钟

AI费用失控？业务可观测性是解药

本文借API分析师Kin Lane之口，指出AI开支失控的根源在于工程与业务之间的鸿沟。他提出业务可观测性概念，通过标签、FinOps和MCP边界治理，让企业看清AI成本与业务价值。

深度The New Stack·5月26日·9 分钟

AC/DC 框架：让团队放心用 AI 编码智能体

AC/DC 框架定义了智能体驱动的开发流程：Guide（引导智能体理解环境）、Generate（生成代码）、Verify（验证代码正确性）、Solve（修复问题闭环）。在规模化智能体开发中，生成环节之外的质量控制才是关键，验证和修复能力决定了 AI 编码的可信度。

深度The New Stack·5月26日·9 分钟

ClickUp裁员22%引入3000个AI Agent

ClickUp裁员22%并引入数千AI Agent，CEO声称这是拥抱AI而非降本。但Gartner调查显示多数公司裁员后并未获得财务回报。有批评者指出“token消耗”不是正确衡量指标。

深度·5月25日·4 分钟

Harness、Scaffold 等 AI Agent 关键词释义

本文是 Hugging Face 发布的 AI Agent 术语表（第一部分），系统解释了模型、Scaffold、Harness、Agent、上下文工程、策略、工具调用、技能、子代理等概念，并区分了训练和推理场景。重点厘清了 harness 和 scaffold 这两个最容易混淆的术语，以及 Agent = 模型 + Harness 的核心关系。

深度Hugging Face·5月25日·8 分钟

Datasette Agent 新版：从菜单启动 AI 对话

Datasette Agent 0.1a4 利用 Datasette 1.0a30 的新插件钩子，在 Jump to 菜单中集成 AI 对话入口。用户输入查询后，AI 可自动执行数据库操作并返回结果。

深度Simon Willison·5月24日·1 分钟

多智能体系统已上线，谁来监控它们？

多智能体系统已在生产中运行，但运营监控存在巨大缺口。团队缺乏对推理链、成本和数据流的可见性，只能调试表象症状。需要基于系统正常行为的监控来识别异常偏离。

深度The New Stack·5月24日·5 分钟

ClickHouse CTO 谈 AI 代理一年实战：效率翻倍，但并非万能

ClickHouse CTO Alexey Milovidov 总结了团队一年来使用 AI 编码代理的实战经验。AI 代理在 boilerplate 编写、合并冲突解决、代码审查和修复 flaky 测试等场景中表现出色，但效率取决于工程师水平。他给出了七条实用建议，并指出 2026 年将是生产力提升之年。

深度The New Stack·5月24日·6 分钟

OpenClaw 30万星后，Google Spark 来了：个人智能体走向分叉

OpenClaw 和 Google Spark 代表了个人智能体的两条路径：自托管 vs 托管。自托管意味着控制权在你手中，但需要运维成本；托管方则提供便利，但需要交出上下文和凭据。历史表明便利性通常胜出，但智能体涉及隐私的深度远超云存储。开发者需要权衡的不是哪个更好，而是是否愿意让 Google 掌握运行你生活的钥匙。

深度The New Stack·5月23日·5 分钟

Anthropic 收购 Stainless：开发者工具链不再中立

Anthropic 收购 Stainless 后，将关停其托管 SDK 生成服务，导致 OpenAI、Google 等竞争对手失去共享的 SDK 生成依赖。这是一系列收购中的最新一步，继 Bun 和 Astral 之后，前沿实验室正在从模型竞争转向工具链竞争，开发者需要重新审视自己使用的“中立”基础设施的真正归属。

深度The New Stack·5月23日·7 分钟

MCP与合成数据重塑AI时代的合规治理

随着AI智能体加速软件开发，敏感数据泄露风险激增。通过MCP协议标准化数据接口、用合成数据替代生产数据副本、将合规控制嵌入管道并运行时执行，组织可实现持续合规，同时加速创新。

深度The New Stack·5月23日·8 分钟

所有模型公司都变成了智能体公司

Greg Brockman 公开表示模型本身不再是产品，这是从“大模型团队”立场的重大反转。AI21 关闭模型团队、DeepSeek 首次组建 Harness 团队，行业正在从纯模型竞争转向模型+框架+工作流+UI+记忆+经济的全栈竞争。但这也可能意味着，通过联合训练模型与闭源框架来进一步收紧模型访问权限。

深度Latent Space·5月23日·8 分钟

GitHub 连续三年领跑 Gartner 企业 AI 编码代理魔方阵

GitHub 连续三年被 Gartner 评为企业 AI 编码代理领域领导者，在执行能力上排名最高。其 Copilot 已服务 14 万组织，年增长超 100%。GitHub 强调从代码生成到审查、安全、治理的全链路智能体能力，并持续投入多模型选择、智能路由和性能优化。

深度GitHub·5月22日·6 分钟

JetBrains 打独立牌：AI 编码工具只剩我没站队

JetBrains 业务发展副总裁在 Google Cloud Next 上阐述独立价值：公司因从未融资而能保持模型中立，产品 Junie 默认 Gemini Flash 但也支持 Anthropic 和 OpenAI。新推出的 JetBrains Central 作为 AI 编码代理的治理和执行层，解决按 seat 定价与代理工作负载不匹配的问题。

深度The New Stack·5月22日·3 分钟