资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 961 篇文章

Claude Code 源码泄露揭示智能体工程细节

Claude Code 源码泄露事件暴露了其智能体执行框架（Harness）的内部设计，包括三层结构化记忆系统、基于 KV 缓存的免费并行子智能体，以及默认启用的不到 20 个工具。尽管 Anthropic 已开始 DMCA 下架，但公开的代码库为研究最先进的智能体工程（Agentic Engineering）提供了宝贵资料。

深度Latent Space·4月1日·5 分钟

datasette-llm-usage 0.2a0 发布

该版本移除了配额和价格估算功能，改为依赖 datasette-llm 进行模型配置。新增配置项可记录完整提示、响应和工具调用到内部数据库，并重新设计了简单提示页面，要求特定权限。

指南Simon Willison·4月1日·1 分钟

llm-all-models-async 0.1：将同步模型转为异步

llm-all-models-async 0.1 插件通过线程池将同步模型包装成异步版本，让 Datasette 等工具能调用原本只支持同步的模型。开发过程中还促成了 LLM 0.30 新增插件钩子机制，方便其他插件扩展。

指南Simon Willison·3月31日·2 分钟

llm 0.30 发布：命令行调用大语言模型

llm 0.30 更新了插件系统，register_models() 钩子现在支持 model_aliases 参数，便于插件处理已注册模型。同时，公共类方法的文档字符串已直接集成到文档中。

指南Simon Willison·3月31日·1 分钟

JetBrains：AI 智能体将重演云 ROI 危机

JetBrains Central 是一个面向 AI 智能体工作流的治理和执行平台，旨在防止智能体成为企业 IT 中又一个失控的层。平台通过语义层聚合代码库、架构和运行时上下文，让智能体获得系统级理解，而非仅依赖提示。JetBrains 采取开放策略，支持连接多种 IDE、CLI 和外部智能体，避免供应商锁定。

深度The New Stack·3月31日·3 分钟

CrewAI 连续两年入选 ET30 榜单

CrewAI 连续第二年入选 Enterprise Tech 30，标志着其在智能体开发领域的认可。报告强调了“智能体开发者崛起”的趋势，AI 原生公司占比从 2022 年的 3% 跃升至 72%。CrewAI 团队表示将继续专注于构建生产级智能体系统。

深度CrewAI·3月31日·3 分钟

Cursor 为《财富》500 强推出自托管 AI 智能体

Cursor 推出自托管云智能体，让企业能在内部环境中运行 AI 编程助手，直接访问私有仓库、依赖项和内部工具，同时保持代码和数据不出境。该功能支持在本地机器、开发箱或远程虚拟机上部署，目前每用户最多可运行 10 个 worker，每团队 50 个。Notion 和 Brex 等公司已成为早期采用者，认为这是让编码智能体具备企业级就绪能力的重要一步。

深度The New Stack·3月31日·4 分钟

Pipevals：可视化评估流水线，为LLM应用打分

Pipevals 通过拖拽式界面构建评估流水线，支持模型调用、数据转换和评分，提供持久化执行引擎和指标仪表盘，帮助团队系统化监控 AI 质量。

指南·3月31日·3 分钟

Claude Code 用户遭遇用量限制异常

Claude Code 用户报告用量限制消耗异常加速，Anthropic 承认问题正在调查。有用户声称发现缓存漏洞导致成本膨胀 10-20 倍，但官方尚未确认。近期政策调整叠加此问题，部分用户考虑转向其他 AI 编程工具。

深度The New Stack·3月31日·3 分钟

LangChain + MongoDB 联手：AI 智能体栈跑在你信任的数据库上

LangChain 与 MongoDB 深度集成，将 MongoDB Atlas 转变为完整的 AI 智能体后端。集成包括 Atlas Vector Search 检索器、LangSmith 的 MongoDB 检查点持久化状态、Text-to-MQL 自然语言查询工具，以及 LangSmith 的端到端追踪。该方案已在多个行业投入生产，帮助团队快速从原型过渡到生产环境。

指南LangChain·3月31日·5 分钟

用 Copilot 构建智能体，我把自己自动化了

作者分享了如何用 GitHub Copilot 作为主要贡献者来构建智能体，并总结了三条关键策略：对话式提示、重视架构重构与文档、以及建立‘归咎于流程而非智能体’的迭代文化。这套方法让团队开发效率大幅提升。

深度GitHub·3月31日·6 分钟

Ollama 集成 MLX 框架，Mac 本地 AI 模型提速

Ollama 通过集成苹果 MLX 框架，利用共享内存模型减少 CPU 与 GPU 间的数据传输开销，从而提升本地模型在苹果硬件上的性能。新增的 NVFP4 格式支持则通过高效压缩模型权重，降低内存占用，使更大模型能在本地运行。这些改进与 OpenClaw 等本地智能体的兴起相呼应，推动本地优先的 AI 栈更接近生产级使用。

深度The New Stack·3月31日·4 分钟

微软 Copilot 让 Claude 与 GPT 协同工作

微软 Copilot 的研究员智能体新增了 Claude 与 GPT 协同的‘审阅’功能，GPT 起草内容，Claude 审核准确性和完整性。基准测试显示这种组合得分更高。微软还推出了 Copilot Cowork，将 Anthropic 的 Claude Cowork 工具集成到 Copilot 中，让企业能在安全边界内使用长流程智能体。

深度The New Stack·3月30日·3 分钟

AI时代的鼠标指针：Google DeepMind 重塑交互

Google DeepMind 提出四项交互原则，将鼠标指针升级为 AI 伙伴。通过“指和说”替代文本提示，指针能理解用户指向的内容和意图。Chrome 和 Googlebook 已率先集成。

指南·3月29日·4 分钟

NemoClaw 三层安全架构，难解智能体根本问题

Nvidia 在 GPU 技术大会上发布 NemoClaw，旨在为流行的开源智能体框架 OpenClaw 提供策略执行、隐私路由和沙箱执行三层安全架构。然而，文章指出这些防护措施存在固有低效性，无法彻底解决安全问题，企业采用智能体的关键瓶颈在于难以雇佣到能识别工作流风险的老练工程师。

深度The New Stack·3月28日·4 分钟

Solo.io 开源 agentevals，解决智能体评估难题

Solo.io 发布了 agentevals 开源框架，旨在帮助开发者评估和基准测试智能体 AI 系统，解决生产部署前的可靠性、延迟和成功率测量问题。同时，该公司将 agentregistry 捐赠给 CNCF，以标准化 AI 能力的编目和管理。

深度The New Stack·3月28日·3 分钟

Anthropic 疯狂三月：14+ 新功能、5 次宕机与意外泄露的 Claude Mythos

Anthropic 在三月以惊人速度推出 Claude 系列更新，涵盖模型升级、可视化、多智能体代码审查等。然而，基础设施压力导致多次服务中断。下一代模型 Claude Mythos 的细节意外泄露，据称在编码和网络安全能力上远超当前版本。同时，MCP 协议安装量飙升至 9700 万，已成为行业标准。

深度The New Stack·3月28日·5 分钟

OpenAI Codex 支持插件，三巨头 AI 编程助手功能趋同

OpenAI 为 Codex 推出插件系统，首批 20 多个插件涵盖 Box、Figma、Linear 等第三方服务，将技能、MCP 服务器和应用连接器打包。这标志着三大 AI 编程助手在插件架构上实现统一，开发者可以更便捷地在不同平台间迁移插件。

深度The New Stack·3月27日·3 分钟