资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 962 篇文章

用 LLM 优化数据库查询，提速 4.78 倍

DBPlanBench 框架将 Apache DataFusion 的物理执行计划序列化为紧凑 JSON，供 LLM 进行语义分析并生成局部优化补丁。实验显示，该方法能修正基数估计错误，在复杂查询上显著降低延迟和内存占用，且优化结果可从小规模数据集迁移到生产环境。

深度·4月3日·6 分钟

智能体安全，别从第三步开始

企业部署 AI 智能体时，常因合规压力直接从身份认证（第三步）入手，却忽略了执行框架（第一步）的可靠性。正确的顺序应是：先构建可靠执行框架，再设计治理规则，最后实施身份验证。

深度CrewAI·4月2日·3 分钟

Simon Willison 谈智能体工程：拐点已过，瓶颈转移

文章整理了Simon Willison在播客访谈中的核心观点，包括2025年11月的AI拐点、软件工程师作为信息工作者风向标、开发瓶颈从编码转向测试、以及使用智能体带来的新挑战（如精神消耗和评估难度）。

深度Simon Willison·4月2日·6 分钟

微软高管警告：智能体 AI 正在掏空初级开发者梯队

微软 CTO Mark Russinovich 和 VP Scott Hanselman 认为，智能体 AI 让资深工程师效率大增，却让初级开发者更难成长，可能导致人才管道崩溃。他们提出导师制（Preceptor Program）作为解决方案，强调培养下一代工程师的判断力至关重要。

深度The New Stack·4月2日·4 分钟

pgEdge 推出 Postgres MCP 服务器，AI 智能体连接数据库新方案

pgEdge 推出开源 MCP Server for Postgres，支持 AI 智能体通过模型上下文协议（MCP）而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化，适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Moonlake：用游戏引擎构建因果世界模型

Moonlake 采用与主流视频生成模型（如 Genie 3）截然不同的路径，强调通过游戏引擎的抽象层高效提取因果关系，构建支持长期、多玩家交互的世界模型。其核心论点是：对于许多具有经济价值的任务，高分辨率像素细节并非必需，而结构化的、能准确反映动作后果的抽象表示更为关键。

深度Latent Space·4月2日·4 分钟

开源模型在智能体任务上已追平闭源模型

开源大语言模型在智能体任务上的表现已接近闭源前沿模型，同时成本大幅降低、延迟显著改善。文章通过 Deep Agents 的评估数据，展示了 GLM-5 和 MiniMax M2.7 的具体性能，并提供了在 SDK 和 CLI 中切换使用开源模型的代码示例。

深度LangChain·4月2日·5 分钟

Gemma 4：迄今最强的开源模型

Gemma 4 是 Google DeepMind 推出的新一代开源大语言模型，包含 E2B、E4B、26B MoE 和 31B Dense 四个版本，在推理、代码生成、多模态处理等方面表现突出。模型针对从移动设备到工作站的不同硬件进行了优化，并以 Apache 2.0 许可证发布，旨在为开发者提供强大且灵活的开源工具。

指南·4月2日·5 分钟

Gemini API 新增 Flex 与 Priority 推理层级

Google 推出 Flex 和 Priority 两个新的推理层级，帮助开发者平衡成本与可靠性。Flex 是成本优化层级，适合后台任务，价格便宜一半；Priority 是最高保障层级，适合用户交互型应用。两者都通过同步接口调用，简化了架构管理。

指南·4月2日·3 分钟

AI 编程智能体如何拖垮 CI/CD 流水线

AI 编程智能体大幅提升了代码生成速度，但验证环节成为新的瓶颈，导致 PR 积压和预发环境崩溃。解决方案在于构建两层现代验证架构：可扩展的临时环境（Ephemeral Environments）和基于技能（Skills）的验证层，让智能体能够自主测试和迭代代码。

深度The New Stack·4月2日·5 分钟

OpenClaw vs. Hermes Agent：持久化AI助手的两种路径

OpenClaw通过广泛的即时通讯平台集成和庞大的技能生态，实现了跨渠道的持久化存在，但面临严峻的安全挑战。Hermes Agent则围绕封闭学习循环构建，具备自主技能创建和自我训练能力，架构更为保守。两者代表了构建持久化AI助手的两种不同哲学。

深度The New Stack·4月2日·5 分钟

智能体工程的七大隐藏技术债

智能体易于构建但难以运维，其核心代码仅占系统的一小部分，真正的技术债务隐藏在集成、上下文管理、可观测性等周边基础设施中。本文详细分析了前两个债务区块：集成和上下文湖，揭示了分散配置和静态上下文文件带来的运维噩梦。

深度The New Stack·4月2日·4 分钟

Codex 推出按量付费团队方案

Codex 新增按量付费团队方案，降低企业使用门槛。ChatGPT Business 年费降价 20%，新团队可获得最高 500 美元使用额度。目前已有超过 200 万开发者每周使用 Codex。

指南OpenAI·4月2日·2 分钟

Deepgram 语音模型原生集成 Together AI

Deepgram 的语音转文本（STT）和文本转语音（TTS）模型已原生集成到 Together AI 的专用模型推理平台。这为构建实时语音智能体提供了统一的解决方案，覆盖了从转录、对话检测到语音合成的全流程，并支持企业级控制。

指南·4月2日·5 分钟

datasette-llm 0.1a6 发布

datasette-llm 0.1a6 版本发布，主要更新包括：默认模型自动添加到允许模型列表，无需重复配置；改进了 Python API 的使用文档。

指南Simon Willison·4月1日·2 分钟

LangChain 2026 年 3 月产品更新与活动预告

LangChain 2026 年 3 月通讯汇总了产品更新、开源发布和社区活动。LangSmith 新增 Fleet 管理、Skills 功能、沙箱预览和审计日志；开源方面，langgraph v1.1 和 deepagents v0.5.0 发布。文章还介绍了智能体执行框架（Harness）的解剖、Open SWE 开源框架，以及 LangChain 的 GTM 智能体案例。

指南LangChain·4月1日·4 分钟

Copilot CLI 用 /fleet 并行运行多个智能体

/fleet 命令让 Copilot CLI 能并行调度多个子智能体，适合跨文件重构、文档生成等场景。提示词需要明确交付物、边界和依赖关系，避免文件冲突。

指南GitHub·4月1日·5 分钟

Claude Code 源码泄露：44 个未发布功能与架构设计

Claude Code 源码泄露揭示了其作为智能体操作系统的架构，包括类似系统调用的工具权限网关、基于能力隔离的多智能体集群，以及实现持久化自主运行的 KAIROS 后台服务。此次泄露为开发者提供了生产级智能体系统的设计参考，也暴露了构建流程的安全风险。

深度The New Stack·4月1日·8 分钟