资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

Claude 小企业版实测：20 个财务陷阱揪出 17 个

测试发现 Claude 能快速发现明显和中等级别的财务问题，但漏掉了几个需要法务会计思维才能察觉的微妙线索。尽管如此，20 分钟完成原本数天的工作量，仍大大提升了效率，但人类监督依然不可或缺。

深度The New Stack·5月22日·4 分钟

Daytona CEO 详解AI代理的计算基础设施

Daytona 为 AI 代理提供可组合的计算机资源，包括快速启动的沙箱（60ms）、动态资源扩展和裸机支持。其采用自研调度器，避开 Kubernetes 的痛点，并计划打造类似 Stripe 的 AI 云服务。

深度Latent Space·5月21日·5 分钟

Datasette Agent 发布：用自然语言查询数据的 AI 助手

Datasette Agent 是一个可扩展的 AI 助手，提供对话式数据查询接口。支持通过插件生成图表、图片和代码执行。可运行本地模型，并已为 Datasette Cloud 用户准备。

指南Simon Willison·5月21日·5 分钟

Datasette Agent 新增 Fly Sprites 工具

datasette-agent-sprites 0.1a0 是 Simon Willison 发布的一个 beats，为 Datasette Agent 增加了与 Fly Sprites 交互的工具。

指南Simon Willison·5月21日·1 分钟

Docusign 推出 MCP Server，让 AI Agent 操作用户协议

Docusign 在 Momentum 2026 上推出 MCP Server、Agreement Manager API、IAM Toolkit 和 Developer Console，让开发者能够构建智能体驱动的协议管理体验。MCP Server 让 Claude、Gemini 等 AI 工具直接操作 Docusign，Agreement Manager API 将分散的协议集中为可搜索数据源，IAM Toolkit 通过配置即代码将实施速度提升 40%，Developer Console 则统一了开发与生产环境管理。

指南The New Stack·5月21日·5 分钟

Google I/O 推 AI 智能体，消费者却不买账

Google 在 I/O 大会上推出信息智能体、Gemini Spark 等 AI 智能体产品，但命名混乱、功能演示浮于表面，且多数功能仅面向每月 100 美元的 Ultra 订阅用户。文章认为 Google 未能向普通消费者清晰展示 AI 智能体的实际价值，反而加深了技术鸿沟。

深度·5月21日·6 分钟

不到1000美元，OpenAI模型推翻了80年数学猜想

OpenAI 的通用推理模型以不到 1000 美元的成本推翻了 Erdos 平面单位距离猜想，证明了大语言模型在数学研究上的潜力。同时，Cohere 发布了 Apache 2.0 开源模型 Command A+，vLLM 首日支持。此外，多个新基准评测了智能体、记忆和科学工作流的表现，结果对当前前沿智能体并不乐观。

深度Latent Space·5月21日·6 分钟

黄仁勋声称发现2000亿美元新市场：AI智能体CPU

英伟达CEO黄仁勋在财报会上称，新CPU产品Vera专为AI智能体设计，开辟了2000亿美元新市场。尽管面临亚马逊等对手竞争，他表示Vera已售出200亿美元，并预测未来将有数十亿AI智能体使用专用CPU。

深度·5月21日·4 分钟

Railway创始人：智能体时代的云和PR之死

Jake Cooper 深入探讨了 Railway 从自建数据中心（3 个月回本）到 Temporal 工作流引擎、Railpack 构建系统、Central Station 内部工具等技术栈选择，并直言“Pull Request 正在死亡”，未来的软件开发生命周期将围绕智能体需求重构。

深度Latent Space·5月20日·6 分钟

Anthropic 每月 12.5 亿美元租下 xAI 算力

Anthropic 以每月 12.5 亿美元的价格租用 xAI 位于孟菲斯的 Colossus 1 数据中心全部算力，合同期限至 2029 年 5 月，总金额超 400 亿美元。该交易通过 SpaceX 的 SEC 文件披露，允许任意一方提前 90 天终止合同。xAI 借此形成“既自用又出租”的混合模式，以消化因 Grok 使用量下降而闲置的算力。

深度·5月20日·3 分钟

OpenAI再称破解80年数学难题，这次有数学家背书

OpenAI 宣称其新推理模型自动推导出数学证明，推翻了一个 80 年未解的几何猜想，并获得了多位数学家的支持。如果验证为真，这将是 AI 首次独立解决一个领域内的重大开放问题。

深度·5月20日·3 分钟

Google I/O 2026 重磅：Gemini Omni、通用购物车等100项发布

Google I/O 2026 大会发布 Gemini 3.5 Flash（即日可用）、Gemini Omni（视频生成模型）、通用购物车（Universal Cart）等。AI 搜索升级为 AI Mode，支持多模态输入和智能代理。Gemini 应用新增 Omni 视频编辑功能。

深度·5月20日·8 分钟

Google I/O 看点：Gemini Spark 与反重力 Agent

作者因“不写自己无法体验的东西”的政策，只关注了已发布的 Gemini 3.5 Flash 和 Gemini Spark。Spark 是一个个人 Agent，连接 Google 应用，运行在 Antigravity 上（包括 CLI、SDK 和 IDE）。企业版强调安全隔离，但作者担心 prompt injection 风险。同时，开源的 Gemini CLI 将于 6 月停用，被闭源的 Antigravity CLI 取代。

深度Simon Willison·5月20日·4 分钟

NanoClaw 创始人拒2000万美元收购，融1200万

NanoClaw 创始人拒绝2000万美元收购，完成1200万美元种子轮融资。项目在6周内从零到获得投资意向，并获得 Andrej Karpathy 和新加坡外交部长的公开赞誉。

深度·5月20日·4 分钟

Figma 上线 AI Agent，自然语言驱动设计

Figma 推出 AI Agent，支持自然语言生成和编辑设计，可同时运行多个 Agent 完成不同任务。该功能首先在 Figma Design 中可用，未来将扩展到其他产品。

指南·5月20日·2 分钟

Cursor 推出 Composer 2.5，降价叫板 Opus 和 GPT

Cursor 发布 Composer 2.5，基于 Moonshot Kimi K2.5 模型，性能在多项基准测试中接近 Opus 4.7 和 GPT-5.5，但输入/输出 token 价格仅为 $0.50/$2.50 每百万，远低于竞品。该版本改进了长期运行任务和指令遵循能力，但也存在奖励黑客等副作用。

深度The New Stack·5月20日·5 分钟

Google I/O 2026：Gemini 3.5 Flash 正式上线，Omni 视频生成、Spark 后台代理齐登场

Google I/O 2026 发布 Gemini 3.5 Flash，支持 1M 上下文窗口和 65K 输出，定价 $1.50/$9.00 每百万 token，第三方评测显示智力指数 55，推理速度超 280 tok/s。Omni Flash 可从文本/图像/视频/音频输入生成视频编辑。Antigravity 2.0 新增 Spark 后台代理和搜索原生生成式 UI。但也有社群质疑定价偏高和部分基准测试表现不足。

深度Latent Space·5月20日·7 分钟

Ramp 工程师用 Codex 把代码审查从几小时缩短到几分钟

Ramp 工程师利用 Codex 与 GPT-5.5 加速代码审查流程，从数小时缩短至几分钟；同时使用 Codex 开发内部智能体工具 On-Call Assistant，大幅提升开发效率。

深度OpenAI·5月20日·5 分钟