资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

Gemini 3.5 Flash 发布：涨价三倍，Google 却用它覆盖全线产品

Google 发布 Gemini 3.5 Flash，价格是前代的 3-6 倍，但被广泛用于自有产品。新模型支持 100 万输入 token、6.5 万输出 token，并引入了类似 OpenAI Responses 的 Interactions API。

深度Simon Willison·5月19日·5 分钟

Google 搜索新玩法：创建 AI 智能体实时监控信息变化

Google 搜索推出 AI 信息智能体功能，用户可创建多个智能体在后台 24/7 监控股市、航班、新闻等话题，并在有重大变化时主动推送摘要和链接。该功能将于今夏面向 AI Pro 和 Ultra 订阅用户首发。

指南·5月19日·3 分钟

谷歌押注智能体，Gemini 3.5 Flash 发布

谷歌发布 Gemini 3.5 Flash，主打编码和智能体任务，速度是其他前沿模型的 4 倍，优化版可达 12 倍。模型可自主运行数小时，并内置更强的安全护栏。

深度·5月19日·4 分钟

传统 Google 搜索终结：AI 重构一切

Google 搜索迎来 25 年来最大变革，AI 生成的交互式体验将取代传统链接列表。用户可创建 24/7 运行的信息代理，也能用自然语言构建个性化 mini 应用。此举将进一步削减对出版商的流量推荐。

深度·5月19日·5 分钟

Android Studio 现可接入 GPT 和 Claude 模型

Google 在 I/O 大会上宣布 Android Studio 支持 GPT 和 Claude 模型，开发者可选用不同模型构建应用。Android CLI 发布 1.0 稳定版，支持 AI 智能体操作。

指南The New Stack·5月19日·3 分钟

Google 想让网站原生支持 AI Agent

Google 在 I/O 2026 上宣布了一系列让网页和 Chrome 适配 AI Agent 的新特性：WebMCP 将进入 Chrome 浏览器，DevTools 对外开放 Agent 接口，并发布了现代 Web 指南来教编码 Agent 使用基线功能。此外，HTML-in-Canvas API 允许在 Canvas 中渲染真实 DOM 元素，开启全新的 Web UI 体验。

深度The New Stack·5月19日·5 分钟

Google I/O 2026：智能体Gemini时代来了

Google I/O 2026的主题是智能体Gemini时代。月处理token数增长7倍至3.2千万亿，850万开发者月活。新发布Gemini Omni模型、Ask YouTube、Docs Live等功能。TPU 8t和8i芯片分别针对训练和推理优化，400亿美元年capex支撑基础设施。

深度·5月19日·8 分钟

Gemini 3.5 Flash 发布：前沿智能与行动能力结合

Gemini 3.5 Flash 是 Google 最新发布的模型，在智能体和编程基准测试上超越前代，支持长期复杂任务的执行。它已集成到 Gemini 应用、AI Mode 和 Google Antigravity 平台，并驱动新的个人 AI 助手 Gemini Spark。

指南·5月19日·6 分钟

Google 发布 Android CLI，让 AI 智能体帮你写安卓应用

Android CLI 1.0 已稳定可用，支持 AI 智能体（如 Claude Code、Codex）通过命令行加速安卓开发。Google 还推出了 Antigravity 可选包，整合了 Android CLI 工具。

指南·5月19日·2 分钟

Google I/O 2026: Gemini 变身全能 AI 中心

Google 在 I/O 2026 上宣布 Gemini 应用将获得多项更新，包括 Daily Brief 个性化摘要、全新 Neural Expressive 界面设计、AI 视频模型 Gemini Omni 以及 24/7 个人智能体 Gemini Spark。这些更新旨在将 Gemini 打造成全能 AI 中心，提升与 ChatGPT 和 Claude 的竞争力。

深度·5月19日·3 分钟

Anthropic 推出 MCP Tunnels 和自托管沙箱，锁定企业 AI Agent 基础设施

Anthropic 推出自托管沙箱和 MCP 隧道，为企业提供安全、私密的 AI Agent 基础设施。沙箱让 Agent 在客户或服务商的基础设施上执行工具，MCP 隧道则让 Agent 安全连接私有网络，无需公网暴露。Clay、Rogo、DoorDash 等客户已在实际场景中使用 Claude Managed Agents。

深度The New Stack·5月19日·6 分钟

生产级RAG系统的检索瓶颈与解决方案

生产级RAG系统在规模扩展时，检索召回率会急剧下降，导致模型基于不完整或无关上下文生成错误答案。问题在于检索架构过于简单，而非模型能力不足。通过构建深度检索、混合搜索、多级排序的统一检索系统，可以在保证低延迟的同时维持高召回，从根本上提升RAG系统的可靠性。

深度The New Stack·5月19日·12 分钟

Steve Yegge 的多智能体编排系统 Gas Town 上云

Gas Town 由 Kilo 提供云托管，降低了自建基础设施的运维负担；Wasteland 作为联邦信任网络，允许开发者和智能体通过 Dolt 和 Git 系统发布任务、认领工作并验证贡献。Yegge 还透露了下一个项目 Gas City，旨在构建更灵活的组织层级与编排系统。

深度The New Stack·5月19日·5 分钟

Cloudflare 与 Anthropic 合作：为 Claude Agent 提供可控的沙箱环境

Cloudflare 与 Anthropic 合作推出 Claude Managed Agents 集成，让开发者利用 Cloudflare Sandboxes 作为 Agent 的执行环境。该方案提供可定制的代理、私有服务连接、浏览器控制、隔离沙箱以及基于 V8 isolate 的轻量级沙箱选项，适合大规模 Agent 部署。

指南·5月19日·7 分钟

Pulumi豪赌AI Agent主导基础设施

Pulumi发布多项新功能，旨在让AI Agent无需人工干预即可完成基础设施管理。包括临时账户、一键CLI工具、新的`pulumi do`命令，以及Neo与监控、告警等工具的集成。Duffy指出，大型语言模型更熟悉通用编程语言而非HCL，这使Pulumi的优势凸显。一个医疗客户曾通过Neo发现了40万条合规违规。

深度The New Stack·5月19日·6 分钟

五分钟看完LLM这半年：编码Agent爆发，本地模型逆袭

Simon Willison 在 PyCon US 2026 闪电演讲中总结了 LLM 领域过去六个月的关键变化：最佳模型多次易主，编码 Agent 在 2025 年 11 月后从“偶尔能用”跨入“日常可用”，开源本地模型（如 Gemma 4、Qwen3.6-35B-A3B）表现惊喜，OpenClaw 等个人 AI 助手成为新焦点。

深度Simon Willison·5月19日·6 分钟

编码智能体推理基准测试：TPS 高 31%，TTFT 快 2 倍

Together AI 针对编码智能体工作负载（长输入、高并发）进行了推理基准测试，结果优于 TensorRT-LLM 和 SGLang。其引擎在 2.5M TPM 负载下 TPS 高 31%，TTFT 仅 0.71 秒（TensorRT-LLM 为 1.1 秒）。搭配 Kimi K2.6 模型，单次请求成本仅 $0.108，比 Claude Opus 4.6 便宜 76%，且编码基准测试性能持平或更优。

深度·5月19日·5 分钟

Anthropic 3亿美元收购SDK自动化公司Stainless

Anthropic 收购了 SDK 自动化初创公司 Stainless，交易金额超3亿美元。Stainless 的自动化工具广泛用于 OpenAI、Google 等AI实验室，收购后这些工具将仅限 Anthropic 内部使用。Stainless 此前已为 Anthropic 生成所有官方 SDK。

深度·5月18日·4 分钟