资讯

AI Agent Skills 生态的最新动态、教程和深度分析

找到 405 篇文章

Cloudflare Email Service 公测，智能体原生收发邮件

Cloudflare Email Service 现已开放公测，集成了邮件发送、接收和处理功能，专为智能体工作流设计。新发布的工具链包括 Agents SDK 的 onEmail 钩子、Email MCP 服务器、Wrangler CLI 命令和开源参考应用 Agentic Inbox，旨在降低构建邮件驱动智能体的门槛。

指南·4月16日·6 分钟

Ecom-RLVE：电商对话智能体的可验证环境

Ecom-RLVE 将 RLVE 框架扩展到电商对话智能体，提供 8 个可验证环境，涵盖产品发现、购物车构建等场景。它采用自适应难度课程和算法验证奖励，训练 Qwen 3 8B 模型，旨在解决 LLM 流畅度不等于任务完成度的问题。

深度Hugging Face·4月16日·6 分钟

OpenAI 更新 Agents SDK，强化企业智能体安全与能力

OpenAI 更新了 Agents SDK，引入沙盒环境以控制智能体运行风险，并提供执行框架（Harness）支持前沿模型。更新旨在提升企业构建长周期任务智能体的能力，目前通过 API 向所有客户开放，采用标准定价。

指南·4月15日·3 分钟

OpenAI Agents SDK 将执行框架与计算分离

OpenAI Agents SDK 更新核心是沙盒工作空间，允许智能体在受控环境中运行，分离执行框架与计算以确保安全性和可扩展性。支持自定义容器或第三方工具创建沙盒，并集成 AWS S3、Google Cloud Storage 等云存储。SDK 仍免费，仅按 API 使用量收费。

深度The New Stack·4月15日·3 分钟

印度初创 Emergent 推出聊天式 AI 助手 Wingman

Emergent 从 vibe-coding 平台扩展到 AI 助手领域，推出 Wingman，主打通过聊天平台集成和“信任边界”设计。该助手旨在处理跨工具工作流，目前面临模糊情境下的稳定性挑战。

指南·4月15日·2 分钟

Cloudflare 发布下一代 AI 智能体平台 Project Think

Project Think 是 Cloudflare Agents SDK 的下一代平台，旨在解决当前 AI 智能体（如 Claude Code）在部署、成本和协作上的痛点。它基于 Durable Objects 构建，提供了持久化执行、子智能体、会话管理和沙箱化代码执行等新原语，使得为每个用户或任务运行一个智能体的边际成本趋近于零。

指南·4月15日·8 分钟

Cloudflare 发布 Agent Lee：用自然语言管理平台

Agent Lee 是 Cloudflare 仪表盘中的 AI 助手，通过自然语言帮助用户管理账户、排查问题、部署资源。它基于 Codemode 将工具转换为 TypeScript API，通过 MCP 权限系统确保安全，并支持生成式 UI 动态创建可视化组件。

指南·4月15日·4 分钟

Cloudflare Browser Run：AI 智能体的专属浏览器

Browser Run 为 AI 智能体提供在 Cloudflare 全球网络上运行浏览器会话的能力，支持通过 Puppeteer、Playwright、CDP 等多种方式控制浏览器。新功能包括实时观察智能体操作、在遇到障碍时允许人工介入、直接暴露 Chrome DevTools Protocol 端点以提供最大控制权，并支持 MCP 客户端和新兴的 WebMCP 标准。

指南·4月15日·8 分钟

Cloudflare Workflows 控制平面重构，支持更高并发

Cloudflare Workflows 控制平面从 V1 升级到 V2，支持更高并发和创建速率，以应对智能体（Agent）工作流激增。新架构通过 SousChef 和 Gatekeeper 组件实现水平扩展，解决了 V1 中 Account Durable Object 的单点瓶颈问题。

深度·4月15日·8 分钟

Agents SDK 新增实验性语音管道

Cloudflare 发布实验性语音管道 @cloudflare/voice，让开发者能轻松为 Agents SDK 智能体添加实时语音交互。管道基于现有 Durable Object 架构，支持连续 STT 和 TTS，提供 React 钩子和客户端库，并内置 Workers AI 提供商。

指南·4月15日·7 分钟

Gitar 用 AI 智能体审查 AI 代码，获 900 万美元融资

Gitar 是一家专注于代码验证的初创公司，其平台利用 AI 智能体执行代码审查、管理 CI/CD 工作流等质量保障任务。公司认为，在 AI 生成代码泛滥的背景下，自动化验证比生成更重要，并已获得 900 万美元融资用于团队扩张和产品开发。

指南·4月15日·2 分钟

IBM 发布 VAKRA：企业级智能体基准测试

VAKRA 是一个可执行的基准测试，用于评估 AI 智能体在模拟企业环境中的表现。它包含四个核心能力测试：API 链式调用、工具选择、多跳推理以及多源多跳推理与策略遵循。测试显示当前模型在 VAKRA 上表现不佳。

深度Hugging Face·4月15日·5 分钟

AI 智能体改写安全规则，工程师必知风险与对策

AI 智能体通过自主读写代码、调用工具等能力扩展了攻击面，包括智能体间交互等传统安全模型无法检测的风险。有效的对策是在模型、系统和人工监督三个层面实施分层控制，如最小权限、内容检查和操作审批。

深度The New Stack·4月15日·5 分钟

OpenAI Agents SDK 更新：原生沙箱与执行框架

OpenAI 更新 Agents SDK，引入原生沙箱执行和模型原生执行框架，提升智能体在文档、文件和系统任务中的能力。SDK 支持可配置内存、沙箱感知编排和便携式工作空间描述，旨在简化生产部署并增强安全性与可扩展性。

指南OpenAI·4月15日·3 分钟

Spring 创始人用 Java 类型系统驯服 AI 智能体

Embabel 是一个基于 Spring Boot 和 Kotlin 的 JVM 智能体框架，旨在通过强类型和 GOAP 规划算法解决企业 AI 应用的确定性问题。框架将 LLM 视为类型系统的参与者，而非黑盒，并支持多模型按步骤选择。

深度The New Stack·4月14日·5 分钟

GitHub 安全代码游戏：用 ProdBot 实战 AI 智能体安全

GitHub 安全代码游戏第四季推出，主题是 AI 智能体安全。玩家将扮演攻击者，在五个渐进关卡中利用自然语言提示，让一个名为 ProdBot 的故意存在漏洞的 AI 助手暴露其不应访问的秘密。游戏无需安装，在 GitHub Codespaces 中即可免费体验，旨在帮助开发者建立识别智能体安全风险的直觉。

指南GitHub·4月14日·4 分钟

Cloudflare Mesh：为AI智能体打造私有网络

Cloudflare Mesh 是一个私有网络服务，将多云环境整合为单一安全网络，支持人类、AI智能体和代码的安全连接。它解决了传统VPN访问慢、风险高的问题，为每个智能体提供身份验证，并通过Cloudflare全球网络路由流量，确保性能和安全。

深度The New Stack·4月14日·3 分钟

Agent 执行框架已死，未来属于纠缠软件

作者认为框架和执行框架正快速商品化，构建成本降低使价值转向不可复制的层，如专有数据和信任。他提出纠缠软件概念，即产品与客户相互适应，并透露 CrewAI 正朝此方向演进，打造能学习客户工作流的平台。

深度CrewAI·4月14日·4 分钟