资讯

AI Agent Skills 生态的最新动态、教程和深度分析

找到 405 篇文章

企业部署 AI 智能体前，先建好沙盒

本文分析了企业部署 AI 智能体（Agent）时面临的风险，如失控、安全漏洞和不可逆操作。开源 API 公司 Naftiko 的联合创始人 Kin Lane 提出，应通过系统思维、契约测试和沙盒环境来管理和验证智能体行为。文中还介绍了开源工具 Microcks 如何帮助企业构建共享的模拟环境，加速开发并降低风险。

深度The New Stack·3月12日·6 分钟

Perplexity 发布 Agent API 等三款新 API

Perplexity 扩展其 API 平台，新增 Embeddings API、Agent API 和 Sandbox API，暴露 Perplexity Computer 的编排层。Agent API 作为智能体工作流的托管运行时，统一了检索、工具执行、推理和多模型回退。新 API 帮助开发者聚焦智能体能力，而非底层集成。

指南The New Stack·3月12日·3 分钟

Replit Agent 4：知识工作智能体登场

Replit Agent 4 的发布揭示了 AI 开发平台向集成化知识工作套件演进的趋势。同期，英伟达 Nemotron 3 Super 模型凭借高效架构引发关注，而智能体编排层（Orchestration）和持久化运行时（Persistent Runtimes）正成为新的技术焦点。

深度Latent Space·3月12日·8 分钟

Together AI 发布实时语音智能体统一方案

Together AI 发布了构建实时语音智能体的统一平台，通过同地部署 STT、LLM、TTS 基础设施，将端到端延迟降至 700 毫秒以下。平台原生支持 Deepgram 的 STT 和 Cartesia 的 TTS 模型，并提供单一 API、统一计费与部署界面，满足企业级安全合规要求。

指南·3月12日·3 分钟

OpenAI 发布智能体编排器 Symphony

Symphony 是 OpenAI 推出的智能体编排（Orchestration）框架，能自动监控任务队列并生成智能体完成开发工作，提供 CI 状态、PR 反馈等证明。它基于执行框架（Harness）工程理念，提供了两种部署方式。

指南·3月11日·2 分钟

Galileo 开源 Agent Control，统一管控企业 AI 智能体

Galileo 推出开源项目 Agent Control，旨在为企业提供集中式的 AI 智能体管控平台，支持跨部署统一实施安全护栏。IDC 预测企业 AI 智能体使用量将激增，此类治理工具需求迫切。

指南The New Stack·3月11日·3 分钟

Deep Agents 新增自主上下文压缩工具

LangChain 为 Deep Agents 添加了自主上下文压缩功能，模型可自行判断何时压缩历史对话。该工具通过中间件实现，已在 CLI 中默认启用，SDK 中需手动配置。测试显示模型使用保守，但能有效提升长对话效率。

指南LangChain·3月11日·4 分钟

JetBrains 定义 AI 智能体遗留的「影子技术债」

JetBrains 指出 AI 编码智能体在缺乏项目结构理解的情况下生成代码，会累积「影子技术债」。公司发布 Junie CLI 作为独立智能体，具备代码库智能；同时推出 Air 环境，支持多智能体协同工作，定位为智能体时代的基础设施层。

深度The New Stack·3月11日·3 分钟

向 Towards Data Science 投稿你的 AI 工程实践

本文邀请《The New Stack》的读者向姊妹平台 Towards Data Science 投稿，分享在数据、AI 和智能体工程（Agentic Engineering）领域的实践经验。文章介绍了投稿要求、受欢迎的内容类型以及作者报酬计划。

指南The New Stack·3月11日·3 分钟

Cloudflare 新规：RFC 9457 错误响应让 AI Agent 成本骤降 98%

Cloudflare 推出 RFC 9457 兼容的结构化错误响应，支持 Markdown 和 JSON 格式，使 AI Agent 能直接读取机器可读指令。此举将错误响应负载和 Token 使用量减少超过 98%，提升 Agent 工作流的效率和成本效益。

深度·3月11日·5 分钟

ChatGPT 如何用社交工程思维防御提示注入

文章分析了 AI 智能体面临的提示注入攻击如何演变为社交工程，强调防御需限制操作影响而非仅检测恶意输入。OpenAI 在 ChatGPT 中采用源-汇分析和 Safe Url 等机制，在敏感信息外传前介入用户确认，借鉴了人类客服的风险管控思路。

深度OpenAI·3月11日·3 分钟

OpenAI 如何为 Responses API 构建智能体运行时

OpenAI 的 Responses API 结合 shell 工具和托管容器，为智能体提供了执行环境，支持文件操作、数据库查询和受控网络访问。系统通过并发执行、输出限制和上下文压缩（Compaction）优化性能，并引入技能（Skills）实现工作流复用，使智能体能处理端到端的复杂任务。

深度OpenAI·3月11日·6 分钟

用 Claude Code 构建咖啡日志平台

Brewlog 是一个自托管的咖啡日志平台，能追踪烘焙商、烘焙批次、咖啡袋、冲煮记录、设备和咖啡馆访问。项目采用 Rust 后端和 Datastar 前端，并集成了基于 LLM 的咖啡袋扫描功能。作者分享了项目设计决策和智能体编程模式。

指南·3月11日·8 分钟

智能体执行框架（Harness）的构成要素

文章定义了智能体执行框架（Harness）的概念，即模型之外的所有代码、配置和执行逻辑。通过分析模型原生能力的局限性，推导出文件系统、代码执行、沙箱环境、内存搜索等关键组件如何帮助智能体完成实际工作。执行框架设计旨在将期望的智能体行为转化为可实现的系统特性。

深度LangChain·3月11日·6 分钟

编码智能体如何重塑工程、产品与设计

编码智能体降低了代码实现成本，使软件构建流程从PRD驱动的瀑布模式转向原型驱动的评审模式。EPD角色随之演变：通才价值飙升，系统思维成为关键技能，所有人需具备产品感，专业门槛提高，角色分化为构建者与评审者。

深度LangChain·3月10日·5 分钟

英伟达将开源 AI 智能体平台 NemoClaw

英伟达即将发布开源 AI 智能体平台 NemoClaw，旨在为企业提供安全部署方案。平台开放给所有公司使用，无论是否采用英伟达芯片。这可能是英伟达应对 AI 智能体安全担忧和行业变化的新策略。

深度The New Stack·3月10日·3 分钟

用 AI 智能体形式化验证 5 万行算法代码

本文记录了使用 AI 智能体（Claude Opus 4.6 + Copilot CLI）对经典教材《算法导论》进行大规模形式化验证的实践。智能体在数周内自动生成了超过 10 万行 F*/Pulse 代码与证明，但核心挑战在于如何有效审计同样由 AI 生成的规范。文章分享了主要发现，包括程序验证工具的有效性、规范审查的难题，以及由此带来的编程语言设计研究机会。

深度·3月10日·5 分钟

数据智能体为何失败？缺的是上下文

文章分析了数据智能体部署失败的原因，指出缺乏业务上下文是关键障碍。现代数据堆栈虽集中了数据，但企业数据仍分散混乱，智能体无法理解业务定义和数据源。上下文层（Context Layer）被视为解决方案，需整合企业数据并提供业务逻辑上下文。

深度·3月10日·4 分钟