资讯

AI Agent Skills 生态的最新动态、教程和深度分析

找到 18 篇文章

DSPy 优化 Datasette Agent 的 SQL 提示词

使用 DSPy 框架评估和优化 Datasette Agent 的 SQL 回答系统提示词。方法包括构建测试框架、生成自动评估数据集、运行优化循环，并发现了多个改进方向。

教程Simon Willison·7月2日·3 分钟

AI编程进入循环时代，验证成最大挑战

AI编程正从提示驱动、规格驱动进入循环驱动时代。循环作为最小工作单元，需要四个层（运行时、验证接口、反馈、控制层）支撑。云原生系统因分布式特性，验证反馈的实时性与真实性矛盾突出。平台团队需要构建共享的验证层，否则循环可能低效甚至失控。

深度The New Stack·6月13日·11 分钟

Claude Code 负责人：不再写提示词，只写循环

循环工程（Loop Engineering）是一种将编码代理从交互式助手转变为长期运行执行系统的编排模式。它利用调度、隔离工作区、验证代理和持久记忆等基础组件，让开发者从手动提示中解放出来。

深度The New Stack·6月10日·6 分钟

从零散指令到可复用工作流：Copilot CLI 自定义 Agent 实战

本文介绍 GitHub Copilot CLI 自定义 Agent 的概念、创建方式与实际工作流案例，涵盖安全审计、基础设施合规、发布文档、事故响应等场景，并给出选择预置 Agent 或自建 Agent 的建议。

指南GitHub·6月9日·14 分钟

OpenAI 推 Lockdown Mode 防提示注入

OpenAI 推出 Lockdown Mode 保护敏感数据免受提示注入攻击。该模式禁用实时浏览、图片检索、深度研究和代理模式，但无法完全消除风险。目前向自服务 ChatGPT Business 账户和符合条件的个人账户推出。

深度·6月6日·2 分钟

AI代码成熟度模型：KubeStellar如何达到81% PR通过率

本文分享了KubeStellar Console项目使用AI编码Agent的实践经验，提出了一个五层AI代码库成熟度模型：辅助、指令、测量、自适应和自维持。核心观点是，Agent的智能不在于模型本身，而在于代码库围绕它构建的测量与反馈回路。通过编写指令文件、建立测试信任层、优先测量后自动化等步骤，项目最终实现了81%的PR通过率和快速的社区问题响应。

指南The New Stack·4月26日·8 分钟

Claude Opus 4.6 与 4.7 系统提示词对比

Claude Opus 4.7 的系统提示词在工具列表、儿童安全、对话风格等方面都有更新。作者用 Claude Code 分析了两个版本的差异，还列出了 Claude 可用的工具清单。

深度Simon Willison·4月18日·3 分钟

Claude 系统提示词变身 Git 时间线

Simon Willison 将 Anthropic 公开的 Claude 系统提示词 Markdown 页面，用 Claude Code 处理成按模型和家族分开的文件，并赋予假的 Git 提交日期。这使得在 GitHub 提交视图中浏览变更成为可能，他本人也借此分析了 Opus 4.6 到 4.7 的提示词变化。

深度Simon Willison·4月18日·2 分钟

Chrome 新功能：一键保存和复用 AI 提示词

Skills 功能允许用户在 Chrome 中保存和复用 AI 提示词，简化重复性任务。用户可创建自定义工作流，或从官方库中直接添加预设技能。功能基于 Chrome 的安全架构，需要用户确认敏感操作。

指南·4月14日·2 分钟

Claude Code 安全审计提示对比实测

作者在 Claude Code 中测试了五种不同的安全审计提示词（Skills/Prompts），对比了它们在发现 SQL 注入、XSS 等漏洞上的效果。实测发现，不同提示词在准确性、覆盖面和误报率上表现不一，选择合适的提示词对安全审计至关重要。

指南AI Coding Daily·3月24日·3 分钟

四个开发者必知的提示工程模式

本文通过‘画一只猫’的比喻，阐述了提示工程的核心在于减少输出方差。介绍了系统指令的权重层级，并详细解析了少样本提示、思维链提示、角色提示和工具增强提示四大模式。最后强调评估和验证的重要性。

指南The New Stack·3月23日·4 分钟

Anthropic 取消长上下文溢价，Claude 百万 token 窗口按标准计费

Anthropic 取消了 Claude Opus 4.6 和 Sonnet 4.6 的长上下文定价附加费，使百万 token 上下文窗口按标准 token 费率计费。这一变化可能影响应用设计，让开发者更自由地发送大型数据集到模型，简化工作流。

深度The New Stack·3月16日·3 分钟

Simon Willison 的智能体工程提示模板

文章介绍了作者在智能体工程中常用的三个提示模板：利用 Claude 的 Artifacts 功能快速构建 HTML 工具原型，使用 LLM 校对博客文本但不代写观点内容，以及用 Claude Opus 生成图像替代文本初稿。每个模板都配有具体的自定义指令示例。

指南Simon Willison·3月16日·2 分钟

ChatGPT 如何用社交工程思维防御提示注入

文章分析了 AI 智能体面临的提示注入攻击如何演变为社交工程，强调防御需限制操作影响而非仅检测恶意输入。OpenAI 在 ChatGPT 中采用源-汇分析和 Safe Url 等机制，在敏感信息外传前介入用户确认，借鉴了人类客服的风险管控思路。

深度OpenAI·3月11日·3 分钟

OpenAI 收购 Promptfoo 强化 AI 安全测试

OpenAI 收购 Promptfoo 以增强其企业 AI 平台 Frontier 的安全测试功能，包括自动化安全测试、开发工作流集成以及监管追溯能力。Promptfoo 的开源项目将继续维护，团队将加入 OpenAI 加速 AI 安全工具开发。

深度OpenAI·3月9日·2 分钟

Clinejection：用 Issue 标题攻破 Cline 生产发布

攻击者利用 Cline 仓库中配置的 AI Issue 分诊工作流，通过精心构造的 Issue 标题进行提示注入，诱使 Claude Code 执行恶意 npm install 命令。随后利用 GitHub Actions 缓存共享机制，实施缓存投毒攻击，窃取了 NPM 发布密钥并发布了被篡改的 cline@2.3.0 版本。Cline 在收到漏洞报告后未能及时处理，导致攻击发生。

深度Simon Willison·3月6日·3 分钟

Claude Code 技巧与 Codex 应用发布

文章汇总了 2026 年 2 月 4 日的 AI 编程新闻，包括 Claude Code 的 10 个技巧、Opus 与 Sonnet 模型对比、Codex 应用发布，以及多项功能更新如多仓库支持、自定义快捷键等。

指南AI Coding Daily·2月4日·3 分钟

StruQ 与 SecAlign：用结构化查询和偏好优化防御提示注入

本文分析了提示注入攻击的成因：LLM 输入中指令与数据未分离，且模型被训练为遵循输入中的任何指令。提出的防御方案包括安全前端（Secure Front-End）分隔输入、结构化指令调优（StruQ）模拟注入训练，以及特殊偏好优化（SecAlign）通过偏好优化增强鲁棒性。实验显示，SecAlign 在保持模型通用能力的同时，将优化攻击成功率降低至 15% 以下。

深度·4月11日·4 分钟