资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 583 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 583 篇文章
OpenAI 收购 Promptfoo 以增强其企业 AI 平台 Frontier 的安全测试功能,包括自动化安全测试、开发工作流集成以及监管追溯能力。Promptfoo 的开源项目将继续维护,团队将加入 OpenAI 加速 AI 安全工具开发。
本指南介绍了 DeepLearning.AI 的「Agent Skills with Anthropic」课程,包括课程结构、工具集成和学习路径。课程面向初学者,免费开放,涵盖从概念到实际应用的完整技能链。
a16z 半年度消费级 AI 全景报告:ChatGPT 周活 9 亿领跑,Agent 作为新品类崛起,地理割裂加剧,传统流量指标越来越低估 AI 的真实使用量。
本期 SkillNav 周刊汇总了 AI Agent 领域的最新动态,涵盖 MCP 生态演进、Agent 安全与沙盒、架构与检索系统、开发实践与工具、行业趋势与协作五大板块。重点包括 MCP 2026 路线图、NVIDIA NeMo Retriever 架构、以及 AI Agent 招募人类作为传感器的现象。
Snowflake Cortex Code CLI 通过新增 dbt 和 Apache Airflow 支持,将 AI 编程助手能力延伸至开源数据管道工具。它利用 Agent Skills 提供调试、优化和测试功能,并推出订阅模式向更广泛用户开放。
作者针对遗留代码场景,用 Claude Opus 和 GPT-5.4 Codex 测试了 Laravel 项目 Bookstack。视频展示了 AI 在处理复杂旧代码时的实际能力,为开发者提供了参考。
autoresearch 是一个由 AI 智能体驱动的自动化研究项目,基于单 GPU 的 nanochat 简化实现。开发者通过编写 Markdown 指令文件(program.md)设定研究目标,智能体则自主修改训练代码(train.py),每轮实验固定 5 分钟,通过比较验证损失(val_bpb)来迭代优化模型。项目设计简洁,包含数据准备、训练和指令三个核心文件,支持在 Claude/Codex 等智能体上运行,并提供了针对小规模计算平台的调优建议和社区分支。
OpenAI 推出 Codex for Open Source 计划,为开源项目核心维护者提供六个月 ChatGPT Pro 和 Codex 访问权限。申请需提供项目影响力证明,如 GitHub stars 或下载量。
NanoClaw 通过 Docker 容器隔离每个 AI 智能体,解决了 OpenClaw 的安全隐患。作者详细演示了从克隆仓库、配置 Claude API 到连接 Slack 并映射本地文件夹的完整步骤。最终实现通过 Slack 安全访问本地文件,验证了容器隔离的有效性。
开源编程智能体通过独立于特定模型提供商的架构,帮助开发者管理不可预测的 token 账单。OpenCode 等工具支持连接多种模型,其 10 美元月费套餐集成了多个中国 AI 实验室的模型,使得低成本订阅成为可能。这标志着 AI 软件栈的价值层正在向智能体层转移。
本周 AI 领域动态频出:GPT-5.4 在专业任务上表现强劲,但成本更高;Anthropic 研究揭示 AI 对就业的冲击有限,但招聘模式可能改变;开发者工具正为智能体优先设计;智能体编排框架 Symphony 和 Paperclip 崭露头角;五角大楼合同风波导致 OpenAI 陷入公关危机,Claude 用户和收入大幅增长。
GitHub 安全实验室开源了一套 AI 驱动的安全审计框架,通过任务流(Taskflow)设计有效控制模型幻觉,已成功发现大量高危漏洞。文章详细介绍了如何在自己的项目上运行这些任务流,并解析了其威胁建模与审计两阶段的工作机制。
企业部署 AI 智能体时,成功的关键在于将智能体与现有数据、API、业务逻辑和人工监督结合。低代码平台 OutSystems 认为,氛围编程(Vibe Coding)的兴起需要企业级安全护栏(Guardrails)和治理平台的支持。
Anthropic 的 Claude for Open Source 计划为符合条件的维护者提供六个月 Claude Max 订阅,OpenAI 的 Codex for Open Source 则提供 ChatGPT Pro 和 API 积分。两家公司通过筛选高影响力项目,旨在将 AI 编码工具植入核心开发者工作流。
NVIDIA NeMo Evaluator 新推出的 nel-assistant 智能体技能,通过对话式交互简化了 LLM 评估的配置流程。它基于模块化模板生成 YAML 配置,自动解析模型卡片获取最优参数,并提供分阶段运行与监控功能。
本文分析了 AI 智能体系统中知识问题与执行问题的区别,指出许多 MCP 服务器被误用于解决知识问题,导致 token 成本飙升。通过将稳定的工作流知识编码到 Markdown 技能文件中,开发者能减少 100 倍上下文消耗,同时利用 MCP 处理动态 API 调用。CompanyOS、Supabase 和微软的实践展示了这种两层架构的生产可行性。
Codex Security 利用 OpenAI 前沿模型和 Codex 智能体,通过构建系统上下文、创建可编辑威胁模型、优先验证问题并提供修复方案,提升安全扫描的置信度。它已开始向 ChatGPT Pro、Enterprise、Business 和 Edu 客户开放研究预览,并支持开源维护者通过 Codex for OSS 项目免费使用。
Descript 通过将视频转录文本分块,让 GPT-5 系列模型计算音节数并预估目标时长,在翻译提示中同时优化时长匹配和语义保真。新系统将可接受语速的片段比例从40-60%提升至73-83%,语义保真度达85.5%。