资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 938 篇文章

Galileo 开源 Agent Control，统一管控企业 AI 智能体

Galileo 推出开源项目 Agent Control，旨在为企业提供集中式的 AI 智能体管控平台，支持跨部署统一实施安全护栏。IDC 预测企业 AI 智能体使用量将激增，此类治理工具需求迫切。

指南The New Stack·3月11日·3 分钟

Deep Agents 新增自主上下文压缩工具

LangChain 为 Deep Agents 添加了自主上下文压缩功能，模型可自行判断何时压缩历史对话。该工具通过中间件实现，已在 CLI 中默认启用，SDK 中需手动配置。测试显示模型使用保守，但能有效提升长对话效率。

指南LangChain·3月11日·4 分钟

VS Code 团队用 AI 实现周更，十年月更终结

微软 VS Code 团队借助 GitHub Copilot 和定制智能体，将发布周期从每月缩短至每周。产品经理能直接编写原型代码并提交 PR，工程师则用智能体自动化代码审查和问题处理。团队认为，让代码库适应智能体是当前工程团队的关键能力。

深度The New Stack·3月11日·4 分钟

JetBrains 定义 AI 智能体遗留的「影子技术债」

JetBrains 指出 AI 编码智能体在缺乏项目结构理解的情况下生成代码，会累积「影子技术债」。公司发布 Junie CLI 作为独立智能体，具备代码库智能；同时推出 Air 环境，支持多智能体协同工作，定位为智能体时代的基础设施层。

深度The New Stack·3月11日·3 分钟

向 Towards Data Science 投稿你的 AI 工程实践

本文邀请《The New Stack》的读者向姊妹平台 Towards Data Science 投稿，分享在数据、AI 和智能体工程（Agentic Engineering）领域的实践经验。文章介绍了投稿要求、受欢迎的内容类型以及作者报酬计划。

指南The New Stack·3月11日·3 分钟

Cloudflare 新规：RFC 9457 错误响应让 AI Agent 成本骤降 98%

Cloudflare 推出 RFC 9457 兼容的结构化错误响应，支持 Markdown 和 JSON 格式，使 AI Agent 能直接读取机器可读指令。此举将错误响应负载和 Token 使用量减少超过 98%，提升 Agent 工作流的效率和成本效益。

深度·3月11日·5 分钟

乐天用 Codex 修复问题速度快一倍

乐天集团通过部署 OpenAI 的 Codex 智能体，显著提升了软件交付的速度和安全性。具体成效包括：将平均恢复时间减少约 50%，在 CI/CD 中自动化代码审查与漏洞检查，并将大型全栈项目的开发周期从季度级压缩到周级。

深度OpenAI·3月11日·4 分钟

ChatGPT 如何用社交工程思维防御提示注入

文章分析了 AI 智能体面临的提示注入攻击如何演变为社交工程，强调防御需限制操作影响而非仅检测恶意输入。OpenAI 在 ChatGPT 中采用源-汇分析和 Safe Url 等机制，在敏感信息外传前介入用户确认，借鉴了人类客服的风险管控思路。

深度OpenAI·3月11日·3 分钟

OpenAI 如何为 Responses API 构建智能体运行时

OpenAI 的 Responses API 结合 shell 工具和托管容器，为智能体提供了执行环境，支持文件操作、数据库查询和受控网络访问。系统通过并发执行、输出限制和上下文压缩（Compaction）优化性能，并引入技能（Skills）实现工作流复用，使智能体能处理端到端的复杂任务。

深度OpenAI·3月11日·6 分钟

GPT-5.4 对比 Opus，Claude Code 新功能与安全警示

文章汇总了 2026 年 3 月 11 日的 AI 编程动态，包括 GPT-5.4 与 Claude Opus 的代码质量对比测试、Claude Code 新功能如代码审查和本地定时任务，以及两起严重安全事件：Claude Code 误删数据库和 GitHub Issue 标题漏洞攻击。

指南AI Coding Daily·3月11日·3 分钟

用 Claude Code 构建咖啡日志平台

Brewlog 是一个自托管的咖啡日志平台，能追踪烘焙商、烘焙批次、咖啡袋、冲煮记录、设备和咖啡馆访问。项目采用 Rust 后端和 Datastar 前端，并集成了基于 LLM 的咖啡袋扫描功能。作者分享了项目设计决策和智能体编程模式。

指南·3月11日·8 分钟

智能体执行框架（Harness）的构成要素

文章定义了智能体执行框架（Harness）的概念，即模型之外的所有代码、配置和执行逻辑。通过分析模型原生能力的局限性，推导出文件系统、代码执行、沙箱环境、内存搜索等关键组件如何帮助智能体完成实际工作。执行框架设计旨在将期望的智能体行为转化为可实现的系统特性。

深度LangChain·3月11日·6 分钟

Together AI 首发 NVIDIA Nemotron 3 Super

Together AI 宣布其 Dedicated Inference 服务已支持 NVIDIA Nemotron 3 Super 模型。该模型采用 Transformer 与 Mamba 混合架构，拥有 100 万 token 上下文窗口，专为复杂推理和多智能体工作流设计。开发者无需管理 GPU 即可部署。

指南·3月11日·3 分钟

编码智能体如何重塑工程、产品与设计

编码智能体降低了代码实现成本，使软件构建流程从PRD驱动的瀑布模式转向原型驱动的评审模式。EPD角色随之演变：通才价值飙升，系统思维成为关键技能，所有人需具备产品感，专业门槛提高，角色分化为构建者与评审者。

深度LangChain·3月10日·5 分钟

GitHub Copilot SDK 让 AI 执行成为应用能力

GitHub Copilot SDK 将智能体执行层开放为可编程能力，支持多步任务委托、结构化上下文执行和应用内嵌入。AI 正从文本接口转向执行接口，改变软件架构。

指南GitHub·3月10日·3 分钟

LLM 神经解剖学：不改权重登顶 AI 排行榜

作者通过两个关键线索——大语言模型能用 Base64 进行完整对话，以及 Goliath-120B 模型层间乱序拼接仍能工作——推测出 Transformer 模型存在“翻译层”和“推理皮层”。基于此，他通过复制中间层，在不改变任何权重的情况下，让模型性能大幅提升，登顶排行榜。

深度·3月10日·5 分钟

英伟达将开源 AI 智能体平台 NemoClaw

英伟达即将发布开源 AI 智能体平台 NemoClaw，旨在为企业提供安全部署方案。平台开放给所有公司使用，无论是否采用英伟达芯片。这可能是英伟达应对 AI 智能体安全担忧和行业变化的新策略。

深度The New Stack·3月10日·3 分钟

用 AI 智能体形式化验证 5 万行算法代码

本文记录了使用 AI 智能体（Claude Opus 4.6 + Copilot CLI）对经典教材《算法导论》进行大规模形式化验证的实践。智能体在数周内自动生成了超过 10 万行 F*/Pulse 代码与证明，但核心挑战在于如何有效审计同样由 AI 生成的规范。文章分享了主要发现，包括程序验证工具的有效性、规范审查的难题，以及由此带来的编程语言设计研究机会。

深度·3月10日·5 分钟