资讯

AI Agent Skills 生态的最新动态、教程和深度分析

找到 405 篇文章

API 门户是企业 AI 代理就绪度的试金石

API 布道师 Kin Lane 认为，AI 代理时代本质上是 API 时代的延续。拥有成熟 API 治理、OpenAPI 规范和开发者门户的企业更容易适应 MCP 和代理化趋势。缺乏这些基础的企业将面临安全和运营挑战，但可以通过梳理现状并逐步改进来追赶。

深度The New Stack·5月12日·8 分钟

Red Hat 推 AgentOps，打通 AI 实验到生产

Red Hat AI 3.4 发布，主打 MaaS 和 AgentOps，通过 vLLM 和 llm-d 实现高性能分布式推理，支持推测解码提升响应速度。平台提供统一控制平面、评估中心和 SPIFFE/SPIRE 身份管理，并与 Nvidia NeMo Guardrails 集成，实现从开发到生产的安全治理。

深度The New Stack·5月12日·5 分钟

AI 科研智能体系统 Co-Scientist 登 Nature，为研究者加速假设生成

Co-Scientist 是一个由 Gemini 驱动的多智能体协作系统，通过“生成-辩论-演化”三个阶段和“观点锦标赛”机制，帮助科学家高效探索和验证假设。文章详述其架构、验证方法，并展示了在肝纤维化、ALS、细胞衰老等多个领域的实际应用案例。

深度·5月12日·8 分钟

SAP 推 AI Agent Hub，终结企业智能体管理混乱

SAP AI Agent Hub 是一个厂商中立的智能体管理平台，提供自动发现、注册、评估、身份与访问控制、可观测性等功能。它整合了 LeanIX、Signavio、Cloud Identity Services 等 SAP 现有资产，形成独特的竞争壁垒。目前已有两项功能正式可用，其余四项计划于 2026 年第三季度推出。

深度The New Stack·5月12日·5 分钟

当AI代理开合并请求，审计记录在哪

AI编码代理在受监管环境中引发四类合规异常：溯源缺失、身份归属不清、决策链不可重构、回滚无边界。CI日志不足以记录代理的上下文和决策，团队需要为代理CI/CD构建可记录的执行层，包括执行记录、身份绑定、策略日志和重放能力。

深度The New Stack·5月12日·6 分钟

Anthropic 训练 Claude 抵抗要挟与自保行为

Anthropic 通过直接训练模型评估分布等方式抑制智能体失调行为，但承认这种训练在分布外场景可能不通用。同时，行业专家强调上下文引擎作为对齐层的重要性，并建议设计可解释性、测试对抗场景。

深度The New Stack·5月11日·6 分钟

AI代理为何没有真正的记忆：生产级记忆架构解析

AI代理的记忆需要持久化、选择性记录、压缩、衰减与遗忘、污染预防五种能力协同工作。文章提出了基于关系型数据库的参考架构，支持结构化查询和向量搜索，并通过置信度衰减和污染处理实现智能记忆管理。

深度The New Stack·5月11日·8 分钟

Arcjet 将安全防线推进到AI智能体内部

Arcjet Guards 将安全策略执行从网络边界迁移到AI智能体内部，覆盖工具调用、队列消息和工作流步骤。它能检测提示注入、拦截PII、控制token预算，并支持多智能体场景。与Cloudflare AI Gateway等代理方案不同，Guards运行在应用内部，能感知业务上下文。

深度The New Stack·5月10日·6 分钟

OncoAgent：保护隐私的肿瘤临床AI双阶多智能体框架

OncoAgent是一个开源、隐私保护的肿瘤学临床决策支持系统。它采用双阶微调LLM架构（9B快速模型和27B深度推理模型）、8节点LangGraph多智能体拓扑、四级校正RAG管道和三重反射安全验证器。项目在AMD Instinct MI300X上通过QLoRA微调，序列打包使全数据集微调仅需50分钟，速度提升56倍。

深度Hugging Face·5月9日·14 分钟

Datadog 和 T-Mobile 高管谈 AI Agent 生产环境部署的真相

AI Agent 在企业中应用增多，但生产环境部署面临挑战。Datadog 和 T-Mobile 等公司强调安全、模拟和人工监督的重要性，避免盲目信任 AI 生成的代码。

深度The New Stack·5月9日·5 分钟

终端未死：Amp 重构 CLI 面向智能体未来

Amp 发布全新 CLI 产品 Neo，支持远程控制、插件系统和压缩优先架构，以适应更长的智能体工作流。与此同时，行业正在争论 AI 编程智能体的主要界面——终端、IDE 还是云端。Amp 认为终端并未过时，而是转变为开发者与智能体交互的控制面板。

深度The New Stack·5月8日·5 分钟

GitHub 智能体工作流 Token 优化实战

本文介绍了 GitHub 团队如何通过日志记录、识别低效模式（如未使用的 MCP 工具、用 GitHub CLI 替代 MCP 数据获取）以及使用有效 Token（ET）指标来衡量优化效果。初步结果显示，五个工作流中有四个实现了 19% 到 62% 的 Token 节省。

深度GitHub·5月7日·10 分钟

AI代理代码PR涌入，如何有效审查？

随着AI代理生成的代码PR激增，传统审查流程面临挑战。本文提供了一套10分钟审查清单，包括检查CI是否被削弱、快速识别重复代码、追踪关键路径验证逻辑、警惕提示注入攻击，以及要求作者提供实现计划。

指南GitHub·5月7日·8 分钟

GitHub 为 MCP AI 编程代理打造免疫系统

GitHub 为 MCP 服务器推出依赖扫描（公开预览）和密钥扫描（正式可用），让 AI 编程代理在开发过程中直接检测并报告安全风险，从而将安全防护左移到代码编写阶段。

深度The New Stack·5月7日·4 分钟

Yugabyte 推 Meko，专治多智能体系统的状态断裂

Yugabyte 发布开源项目 Meko，专为多智能体 AI 系统解决状态管理和记忆共享难题。Meko 提供“数据包”（datapacks）和“决策追踪”（decision traces）功能，帮助团队共享上下文、记录决策历史，避免因状态不一致导致的系统失败。Yugabyte 认为，未来智能体框架的核心竞争力在于记忆层基础设施。

深度The New Stack·5月7日·7 分钟

Flue: 像 Claude Code 但可编程的智能体框架

Flue 是 Astro 团队开源的 TypeScript 智能体框架，设计为可编程的 Claude Code——无 TUI/GUI，纯 TypeScript 编写。它内置虚拟沙箱（默认）或支持容器沙箱，通过 Markdown 文件（skills、context、AGENTS.md）驱动智能体逻辑。本文展示了 Hello World、客服、Issue 分类、编码智能体和远程 MCP 工具等五个示例。

指南·5月7日·10 分钟

Copilot Agent 验证：用支配分析构建信任层

传统测试方法无法应对 AI Agent 的非确定性行为。本文提出用前缀树接受器（PTA）建模执行轨迹，通过语义合并和支配分析提取必经状态，构建可解释、轻量级的验证框架。

深度GitHub·5月6日·6 分钟

Cursor AI智能体10秒删光生产库：凭证危机浮出水面

PocketOS数据库删除、LiteLLM供应链攻击、Vercel OAuth入侵——三起事件均指向同一个结构性问题：AI智能体的凭证治理远落后于采用速度。机器身份已远超人类身份，但大多数组织仍缺乏针对AI身份的生命周期管理。

深度The New Stack·5月6日·10 分钟