资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 938 篇文章

GitHub Copilot 代码审查：一年增长 10 倍

GitHub Copilot 代码审查功能在过去一年实现 10 倍增长，通过转向智能体架构，结合上下文检索和推理，提升了审查的准确性、信号价值和速度。超过 12,000 家组织已默认启用此功能，帮助团队应对 AI 加速开发带来的代码审查挑战。

指南GitHub·3月5日·4 分钟

CrewAI 认知记忆系统：智能体如何真正学会

文章剖析了传统智能体记忆系统的问题，介绍了 CrewAI 新推出的认知记忆系统。该系统将记忆视为主动的认知过程，包含编码、巩固、回忆、提取、遗忘五大操作，并详细解释了其背后的编码流和回忆流两个智能体系统的工作原理。最后展示了该系统如何解锁人机协同学习、研究系统积累、多智能体团队共享理解等新能力。

深度CrewAI·3月5日·8 分钟

LangChain 分享技能评估最佳实践

本文分享了 LangChain 团队评估智能体技能（Skills）的流程与最佳实践，包括如何设置测试环境、定义任务与指标、设计技能内容，以及通过 LangSmith 进行性能对比与迭代。

指南LangChain·3月5日·5 分钟

GPT-5.4 发布：更强但更贵

GPT-5.4 在编码、文档处理和智能体任务上表现提升，错误率显著降低，但定价大幅上涨。新模型在 API 中移除了百万 token 窗口的测试标签，并支持实时显示思考计划。

指南The New Stack·3月5日·3 分钟

GitHub 与 Andela 如何让全球开发者用上 AI

全球开发者面临 AI 技能获取不平等问题，GitHub 与 Andela 通过结构化培训将 Copilot 集成到日常开发中。开发者反馈，AI 工具加速了系统熟悉过程，提升了工作信心和效率。

深度GitHub·3月5日·5 分钟

AI 重写开源代码，能绕过 LGPL 协议吗？

本文探讨了使用 AI 编码智能体（如 Claude Code）进行‘净室实现’式代码重写的法律与伦理问题，以 chardet 库的许可证争议为例。维护者通过 AI 工具重写代码并更换许可证，但原作者认为这侵犯了 LGPL 协议。文章分析了双方论点，并指出这将是开源和商业领域面临的普遍挑战。

深度Simon Willison·3月5日·4 分钟

机器人 AI 上嵌入式平台：数据集录制与 VLA 微调

本文介绍了在嵌入式机器人平台部署 VLA 模型面临的延迟和系统挑战。第一部分重点讲解数据集录制的最佳实践，包括摄像头配置、数据多样性和微调过程，为后续优化奠定基础。

指南Hugging Face·3月5日·5 分钟

推理模型难以控制思维链，这是好事

OpenAI 研究发现，当前前沿推理模型在控制思维链（Chain of Thought）方面表现不佳，平均可控性得分低于 15.4%。这种低可控性使得思维链监控更可靠，但未来仍需持续评估。

深度OpenAI·3月5日·5 分钟

执行框架工程真有价值吗？

文章探讨了 AI 智能体开发中“大模型”与“大框架”的价值之争。一方认为模型能力是核心，框架应极简；另一方则通过实验证明，优化框架能大幅提升不同模型的编码表现。随着 Cursor 估值达 500 亿美元，框架工程的价值正被重新审视。

深度Latent Space·3月5日·6 分钟

Box CEO：每个智能体都需要一个盒子

Box CEO Aaron Levie 在访谈中指出，智能体将比人类数量多一个数量级，企业必须构建基础设施来管理其数据访问、权限和安全。未来的工作模式将围绕如何让智能体高效运行而改变，而非相反。

深度Latent Space·3月5日·3 分钟

Together AI 发布七项 AI 原生云技术

Together AI 发布了 FlashAttention-4、Together Megakernel、together.compile 等内核优化，以及强化学习 API、ThunderAgent 智能体调度系统。同时推出了 ATLAS-2 在线推测解码和 CPD 缓存感知推理架构，旨在提升 AI 应用的性能和效率。

深度·3月5日·6 分钟

ChatGPT for Excel 公测，GPT-5.4 加速金融建模

ChatGPT for Excel 插件可将 AI 直接嵌入电子表格，用于构建模型、运行场景分析和生成输出。同时，GPT-5.4 模型增强了金融推理和 Excel 建模能力，并集成了多家金融数据提供商。

指南OpenAI·3月5日·4 分钟

企业开发需要 AI 空中交通管制

AI 工具碎片化导致效率低下，企业需通过平台编排（Platform Orchestration）平衡开发者自由与合规要求。平台充当空中交通管制员，统一控制、提供上下文、验证输出，实现可持续创新。

深度The New Stack·3月4日·5 分钟

OpenAI Codex 登陆 Windows，原生沙盒支持 PowerShell

Codex Windows 版提供原生沙盒、PowerShell 支持和 WinUI 技能，界面与 Mac 版基本一致，默认使用 GPT-5.3-Codex 模型。该应用聚焦智能体管理而非代码本身，现面向所有 ChatGPT 用户开放。

指南The New Stack·3月4日·2 分钟

LangSmith CLI 发布，Claude Code 任务通过率从 17% 跃升至 92%

LangSmith CLI 是一个为智能体原生设计的命令行工具，配合技能包（Skills）使用，能让 Claude Code 等编程智能体流畅操作 LangSmith 平台。技能包包含追踪、数据集构建和评估三大核心功能，显著提升了智能体在 LangSmith 任务上的表现。

指南LangChain·3月4日·3 分钟

LangChain Skills 发布，Claude Code 任务通过率从 25% 提升至 95%

LangChain 发布了首批针对其开源生态的 Skills，包含 LangChain、LangGraph 和 Deep Agents 三大类共 11 项技能。这些技能通过按需加载的方式，显著提升了 Claude Code 等 AI 编程智能体在 LangChain 相关任务上的表现。安装可通过 npx skills 命令完成。

指南LangChain·3月4日·3 分钟

Claude Code 简化命令、宕机与 AI 开发未来

本文汇总了 AI 编程社区一周动态，包括 Claude Code 新功能如 /simplify 命令、Git Worktrees 支持并行代理、自动记忆功能，以及 Anthropic 服务可靠性问题。同时分享了 Laracon EU 会议上关于开发者未来角色的思考。

指南AI Coding Daily·3月4日·2 分钟

Anthropic 年收入 190 亿美元，通义千问团队出走

Anthropic 年收入达 190 亿美元，逼近 OpenAI 的 200 亿美元。通义千问团队核心成员因内部政治原因集体离职，引发对开源模型生态的担忧。Google 和 OpenAI 则分别发布了强调速度与成本效益的 Gemini 3.1 Flash-Lite 和旨在提升对话自然度的 GPT-5.3 Instant。

深度Latent Space·3月4日·7 分钟