资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 941 篇文章

LLM 对战游戏：用代码控制单位战斗

这是一个让 LLM 编写代码控制单位对战的游戏，通过迭代改进代码进行比赛。Gemini 3.1 Pro 在比赛中表现突出，Claude Sonnet 4.6 意外超越了 Opus 4.6。

深度·3月23日·2 分钟

GitHub 用 AI 检测扩展应用安全覆盖

GitHub 推出 AI 安全检测功能，与 CodeQL 静态分析互补，扩展对 Shell、Dockerfile、Terraform 等生态的支持。检测结果直接集成到 PR 工作流，结合 Copilot Autofix 快速修复漏洞，帮助团队在合并点强制执行安全策略。

指南GitHub·3月23日·3 分钟

MCP 当道，你的 API 依然重要

文章分析了 API 与 MCP 在智能体应用中的不同角色：API 提供结构化、可控的访问，适合安全敏感场景；MCP 则支持动态工具发现，更节省 Token。作者建议根据具体用例选择，并提及了通过 Spring AI 包装 API 等混合策略。

深度The New Stack·3月23日·4 分钟

Starlette 1.0 Skill 快速上手指南

Starlette 1.0 Skill 提供了使用 Starlette 框架开发 Web 应用的实用指南。演示项目通过任务管理应用实例，展示了 Starlette 在路由、模板、异步数据库和实时更新方面的灵活性。

指南Simon Willison·3月23日·2 分钟

用 Claude Skill 尝鲜 Starlette 1.0

Starlette 1.0 发布，最大的变化是引入了基于异步上下文管理器的 lifespan 机制。作者利用 Claude 的 Skill 功能，让 AI 克隆代码库并学习新版本特性，然后成功生成了一个包含项目、任务、评论和标签的完整任务管理应用。

教程Simon Willison·3月22日·5 分钟

AI 编程技能安全审计：14 万漏洞与防护缺口

安全公司 Mobb.ai 审计了来自 skills.sh、ClawHub、GitHub 和 Tessl 四个公共注册表的 2.2 万多个 AI 编程技能，发现超 14 万个安全风险。研究发现，尽管注册表有安全扫描，但技能安装后缺乏运行时防护，存在 API 劫持、隐藏恶意指令等实际案例。报告向注册表运营商、AI 工具厂商和行业提出了安全建议。

深度The New Stack·3月22日·6 分钟

用 AI 编程助手玩转 Git 高阶操作

本文介绍了如何利用 AI 编程助手高效使用 Git，涵盖基础操作、冲突解决、历史重写和调试技巧。助手能处理复杂任务，让开发者更轻松地管理代码版本。

指南Simon Willison·3月21日·5 分钟

Cursor 模型成本降 10 倍，Meta 智能体失控

Cursor 推出成本效益极高的 Composer 2 模型，显著降低 AI 辅助编程成本。AI 智能体在快速生成代码的同时，也暴露出安全与代码质量隐患。美国国会提出近 300 页的 AI 法案草案，旨在统一联邦层面的 AI 监管。

深度The New Stack·3月21日·5 分钟

19 小时做了个本地密码管理器：Rust 加密 + Touch ID，已开源

一个人 + Claude Code，从空目录到可用的 macOS 密码管理器。双层加密、Touch ID、中英双语，19 小时交付并开源。

深度·3月21日·10 分钟

Dreamer：个人智能体操作系统

Dreamer 平台旨在让非技术用户也能轻松使用和构建 AI 智能体，其 Sidekick 智能体可协助用户完成日常任务并创建定制化应用。平台提供完整的开发栈，包括 SDK、数据库和服务器，并积极构建开发者生态，设立奖金激励工具开发。

指南Latent Space·3月20日·3 分钟

AI 写基础设施代码，为何团队不敢用

AI 工具让基础设施即代码（IaC）的学习曲线消失，但生成的代码可能难以理解，导致生产风险。Spacelift 的 Intent 产品让 LLM 直接查询云提供商模式，实时操作资源，同时通过确定性策略和上下文层确保安全。平台团队需要在速度与控制之间找到平衡，为 LLM 建立类似人类的护栏。

深度The New Stack·3月20日·3 分钟

一天内微调专属领域向量嵌入模型

本文介绍了如何利用 NVIDIA 开源工具链，通过合成数据生成、困难负样本挖掘和多跳问题训练，快速微调向量嵌入模型以适配特定领域。该方法显著提升了 RAG 系统的检索性能，并提供了完整的代码和数据集。

教程Hugging Face·3月20日·8 分钟

中国开源 AI 下载量反超美国，但英伟达仍掌控底层

Hugging Face 2026 年春季报告揭示，中国开源 AI 模型在近期下载量及四年累计下载量上均领先美国，DeepSeek R1 等模型是主要推动力。与此同时，英伟达在 GPU 硬件和软件生态上保持主导地位，多数模型仍依赖其架构运行。

深度The New Stack·3月20日·4 分钟

OpenAI 收购 Astral，Python 工具将整合进 Codex

OpenAI 收购 Astral，旨在将后者的开源 Python 开发工具引入 Codex 生态系统，以支持完整的开发工作流。尽管承诺开源连续性，但治理细节模糊，引发社区对 Python 生态未来影响的关注。

深度The New Stack·3月20日·3 分钟

AI 实验室竞购开发者工具：Astral、Bun 与 Antigravity

本文梳理了近期 AI 实验室收购开发者工具的动态，包括 OpenAI 收购 Astral、Anthropic 收购 Bun 等。文章分析了这一趋势背后的战略转向，即从单纯提供模型 API 转向构建持久的开发者工作流和智能体原生体验。同时，文章还汇总了 Cursor Composer 2 发布、LangSmith Fleet 上线等最新行业动态。

深度Latent Space·3月20日·5 分钟

Workers AI 上线 Kimi K2.5，智能体成本直降 77%

Cloudflare Workers AI 平台现已支持 Kimi K2.5 大模型，为智能体（Agent）提供推理能力。平台通过自定义内核优化、前缀缓存和异步 API 等改进，显著提升了性能并降低了成本。内部用例表明，使用 Kimi K2.5 可将特定智能体年成本削减 77%。

指南·3月19日·5 分钟

Visitran：AI 驱动的 Python 数据转换平台

Visitran 是一个现代化的、AI 原生的 Pythonic 数据转换平台，提供可视化 IDE 和 AI 助手。它支持多种数据库，具备完整的 Python 转换模型、DAG 执行引擎和任务调度功能，适合数据工程师和分析师使用。

指南·3月19日·8 分钟

LangSmith Fleet：企业级智能体管理平台发布

LangSmith Fleet 将智能体构建工具升级为企业级管理平台，新增分层权限、身份认证、收件箱和可观测性功能。平台支持团队安全共享智能体，并提供完整的审计追踪记录。

指南LangChain·3月19日·4 分钟