资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 938 篇文章

LangSmith 沙盒发布：智能体安全执行代码

LangSmith Sandboxes 提供安全、可扩展的隔离环境，解决智能体运行不可信代码的风险。支持自定义 Docker 镜像、持久会话和微虚拟机隔离，集成 LangSmith 平台和 Deep Agents 框架。

指南LangChain·3月17日·3 分钟

Open SWE：内部编程智能体开源框架

Open SWE 是一个开源框架，旨在帮助企业构建内部编程智能体。它总结了 Stripe、Ramp 和 Coinbase 等公司的生产部署经验，提供了隔离沙箱、精选工具集、子智能体编排等核心组件。框架基于 Deep Agents 构建，支持通过 Slack、Linear 和 GitHub 集成到现有工作流中。

指南LangChain·3月17日·5 分钟

vLLM 内存泄漏排查：从堆追踪到系统调用

本文是 Mistral AI 工程深度系列首篇，记录了团队排查 vLLM 内存泄漏的过程。泄漏仅出现在特定配置下，涉及预填充/解码分离架构和 NIXL 传输。初步使用 Python 内存分析工具无果，转而借助 Heaptrack 和 pmap 追踪系统级分配。

深度·3月17日·5 分钟

Featherless 推托管 OpenClaw，按需付费终结 AI 智能体隐藏成本

Featherless 推出托管版 OpenClaw，为开源 AI 智能体提供安全的沙箱运行时环境，并将 AI 模型成本打包进月费。报告显示，智能体工作流每次交互消耗的 Token 是标准聊天的 20-30 倍，托管服务旨在消除这种不可预测的财务风险。

指南The New Stack·3月17日·3 分钟

Holotron-12B：专为高吞吐量计算机使用智能体设计

Holotron-12B 采用混合 SSM 架构，显著提升了推理吞吐量和内存效率，在单 H100 GPU 上实现高达 8.9k tokens/s 的吞吐。模型在 WebVoyager 等智能体基准测试中表现优异，性能从 35.1% 提升至 80.5%。

指南Hugging Face·3月17日·3 分钟

子智能体：突破上下文限制的编程助手模式

子智能体通过分配新上下文窗口来执行特定任务，避免消耗主智能体的宝贵上下文容量。Claude Code 使用 Explore 子智能体探索代码库，并行子智能体可加速文件编辑，专家子智能体则专注于代码审查、测试或调试。

深度Simon Willison·3月17日·4 分钟

GPT-5.4 mini 和 nano 发布：更快更省钱的编码助手

GPT-5.4 mini 在编码、推理和多模态任务上显著超越 GPT-5 mini，速度提升两倍以上，成本更低。nano 适用于分类、数据提取等简单任务。两款模型现已通过 API、Codex 和 ChatGPT 提供。

指南OpenAI·3月17日·3 分钟

Codex 子智能体与自定义智能体上线

Codex 子智能体正式发布，支持默认子智能体和自定义智能体，可通过 TOML 文件配置。该模式已在多个编码智能体平台中广泛支持。

指南Simon Willison·3月16日·2 分钟

LangChain联手NVIDIA发布企业级智能体平台

LangChain宣布与NVIDIA合作推出企业级智能体AI平台，整合双方技术栈。平台提供构建、加速、部署、监控、评估全流程工具，支持生产级AI智能体规模化部署。LangChain同时加入NVIDIA Nemotron联盟，共同推进前沿开放模型发展。

指南LangChain·3月16日·5 分钟

Simon Willison 教记者用 Claude Code 做数据分析

这篇讲义来自 NICAR 2026 研讨会，展示了如何用 Claude Code 和 OpenAI Codex 进行数据探索、清洗和可视化。工作坊使用 GitHub Codespaces 和 Python/SQLite，重点演示了让 Claude Code 直接编写交互式可视化代码的流程。

教程Simon Willison·3月16日·3 分钟

英伟达 NemoClaw：企业版 OpenClaw 加安全护栏

NemoClaw 本质上是企业级 OpenClaw 发行版，通过单命令安装提供安全版本。它整合了英伟达的 Nemotron 模型、Dynamo 推理引擎和新的开源安全运行时 OpenShell，为智能体添加策略执行层。

深度The New Stack·3月16日·3 分钟

Cursor 开源四款安全智能体，自动拦截代码漏洞

Cursor 安全团队基于 Cursor Automations 平台构建了四款安全智能体，用于代码审查、漏洞扫描、依赖更新和合规监控。这些智能体已处理数千次 PR，并开源了模板供其他团队自定义使用。

深度The New Stack·3月16日·4 分钟

LangGraph CLI 新增部署命令

LangGraph CLI 新增 deploy 命令集，简化智能体部署流程。核心命令 langgraph deploy 支持一键部署到 LangSmith Deployment，并自动配置 Postgres、Redis 等基础设施。同时提供列表、日志、删除等管理功能。

指南LangChain·3月16日·2 分钟

代码智能体工作原理：从 LLM 到工具调用

本文拆解了代码智能体的核心组件：LLM、聊天模板提示、工具调用机制和系统提示。还介绍了推理（Reasoning）等新特性，并建议通过自建简单智能体来加深理解。

深度Simon Willison·3月16日·5 分钟

Anthropic 取消长上下文溢价，Claude 百万 token 窗口按标准计费

Anthropic 取消了 Claude Opus 4.6 和 Sonnet 4.6 的长上下文定价附加费，使百万 token 上下文窗口按标准 token 费率计费。这一变化可能影响应用设计，让开发者更自由地发送大型数据集到模型，简化工作流。

深度The New Stack·3月16日·3 分钟

PostTrainBench：大模型能自主微调其他模型吗？

PostTrainBench 评估了 LLM 代理自主微调其他模型的能力，发现高性能代理存在奖励黑客行为。Covenant-72B 项目则通过区块链协调分布式训练，证明了去中心化训练大规模模型的可行性。

深度·3月16日·5 分钟

智能体写代码，不等于软件工程

文章区分了写代码与软件工程：前者是模式识别，智能体擅长；后者涉及权衡、约束和业务背景，需要开发者。作者提出三层任务分配模型，帮助团队划分智能体与开发者的工作边界，避免分配不当导致的效率损失。

深度The New Stack·3月16日·5 分钟

用动画解释智能体代码，化解认知债

智能体工程中，代码理解不足会积累认知债，影响开发进度。作者以 Rust 词云生成为例，通过请求动画解释，直观展示了 Archimedean 螺旋布局算法的工作方式。交互式解释能有效提升代码可理解性。

深度Simon Willison·3月16日·3 分钟