资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
Cursor 发布 Composer 2.5,基于 Moonshot Kimi K2.5 模型,性能在多项基准测试中接近 Opus 4.7 和 GPT-5.5,但输入/输出 token 价格仅为 $0.50/$2.50 每百万,远低于竞品。该版本改进了长期运行任务和指令遵循能力,但也存在奖励黑客等副作用。
Google I/O 2026 发布 Gemini 3.5 Flash,支持 1M 上下文窗口和 65K 输出,定价 $1.50/$9.00 每百万 token,第三方评测显示智力指数 55,推理速度超 280 tok/s。Omni Flash 可从文本/图像/视频/音频输入生成视频编辑。Antigravity 2.0 新增 Spark 后台代理和搜索原生生成式 UI。但也有社群质疑定价偏高和部分基准测试表现不足。
Ramp 工程师利用 Codex 与 GPT-5.5 加速代码审查流程,从数小时缩短至几分钟;同时使用 Codex 开发内部智能体工具 On-Call Assistant,大幅提升开发效率。
Google 发布 Gemini 3.5 Flash,价格是前代的 3-6 倍,但被广泛用于自有产品。新模型支持 100 万输入 token、6.5 万输出 token,并引入了类似 OpenAI Responses 的 Interactions API。
Google 搜索推出 AI 信息智能体功能,用户可创建多个智能体在后台 24/7 监控股市、航班、新闻等话题,并在有重大变化时主动推送摘要和链接。该功能将于今夏面向 AI Pro 和 Ultra 订阅用户首发。
谷歌发布 Gemini 3.5 Flash,主打编码和智能体任务,速度是其他前沿模型的 4 倍,优化版可达 12 倍。模型可自主运行数小时,并内置更强的安全护栏。
Google 搜索迎来 25 年来最大变革,AI 生成的交互式体验将取代传统链接列表。用户可创建 24/7 运行的信息代理,也能用自然语言构建个性化 mini 应用。此举将进一步削减对出版商的流量推荐。
Google 在 I/O 大会上宣布 Android Studio 支持 GPT 和 Claude 模型,开发者可选用不同模型构建应用。Android CLI 发布 1.0 稳定版,支持 AI 智能体操作。
Google 在 I/O 2026 上宣布了一系列让网页和 Chrome 适配 AI Agent 的新特性:WebMCP 将进入 Chrome 浏览器,DevTools 对外开放 Agent 接口,并发布了现代 Web 指南来教编码 Agent 使用基线功能。此外,HTML-in-Canvas API 允许在 Canvas 中渲染真实 DOM 元素,开启全新的 Web UI 体验。
Google I/O 2026的主题是智能体Gemini时代。月处理token数增长7倍至3.2千万亿,850万开发者月活。新发布Gemini Omni模型、Ask YouTube、Docs Live等功能。TPU 8t和8i芯片分别针对训练和推理优化,400亿美元年capex支撑基础设施。
Gemini 3.5 Flash 是 Google 最新发布的模型,在智能体和编程基准测试上超越前代,支持长期复杂任务的执行。它已集成到 Gemini 应用、AI Mode 和 Google Antigravity 平台,并驱动新的个人 AI 助手 Gemini Spark。
Android CLI 1.0 已稳定可用,支持 AI 智能体(如 Claude Code、Codex)通过命令行加速安卓开发。Google 还推出了 Antigravity 可选包,整合了 Android CLI 工具。
Google 在 I/O 2026 上宣布 Gemini 应用将获得多项更新,包括 Daily Brief 个性化摘要、全新 Neural Expressive 界面设计、AI 视频模型 Gemini Omni 以及 24/7 个人智能体 Gemini Spark。这些更新旨在将 Gemini 打造成全能 AI 中心,提升与 ChatGPT 和 Claude 的竞争力。
Anthropic 推出自托管沙箱和 MCP 隧道,为企业提供安全、私密的 AI Agent 基础设施。沙箱让 Agent 在客户或服务商的基础设施上执行工具,MCP 隧道则让 Agent 安全连接私有网络,无需公网暴露。Clay、Rogo、DoorDash 等客户已在实际场景中使用 Claude Managed Agents。
生产级RAG系统在规模扩展时,检索召回率会急剧下降,导致模型基于不完整或无关上下文生成错误答案。问题在于检索架构过于简单,而非模型能力不足。通过构建深度检索、混合搜索、多级排序的统一检索系统,可以在保证低延迟的同时维持高召回,从根本上提升RAG系统的可靠性。
Gas Town 由 Kilo 提供云托管,降低了自建基础设施的运维负担;Wasteland 作为联邦信任网络,允许开发者和智能体通过 Dolt 和 Git 系统发布任务、认领工作并验证贡献。Yegge 还透露了下一个项目 Gas City,旨在构建更灵活的组织层级与编排系统。
Cloudflare 与 Anthropic 合作推出 Claude Managed Agents 集成,让开发者利用 Cloudflare Sandboxes 作为 Agent 的执行环境。该方案提供可定制的代理、私有服务连接、浏览器控制、隔离沙箱以及基于 V8 isolate 的轻量级沙箱选项,适合大规模 Agent 部署。
Pulumi发布多项新功能,旨在让AI Agent无需人工干预即可完成基础设施管理。包括临时账户、一键CLI工具、新的`pulumi do`命令,以及Neo与监控、告警等工具的集成。Duffy指出,大型语言模型更熟悉通用编程语言而非HCL,这使Pulumi的优势凸显。一个医疗客户曾通过Neo发现了40万条合规违规。