资讯
AI Agent Skills 生态的最新动态、教程和深度分析
找到 13 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
找到 13 篇文章
本文分享了KubeStellar Console项目使用AI编码Agent的实践经验,提出了一个五层AI代码库成熟度模型:辅助、指令、测量、自适应和自维持。核心观点是,Agent的智能不在于模型本身,而在于代码库围绕它构建的测量与反馈回路。通过编写指令文件、建立测试信任层、优先测量后自动化等步骤,项目最终实现了81%的PR通过率和快速的社区问题响应。
Claude Opus 4.7 的系统提示词在工具列表、儿童安全、对话风格等方面都有更新。作者用 Claude Code 分析了两个版本的差异,还列出了 Claude 可用的工具清单。
Simon Willison 将 Anthropic 公开的 Claude 系统提示词 Markdown 页面,用 Claude Code 处理成按模型和家族分开的文件,并赋予假的 Git 提交日期。这使得在 GitHub 提交视图中浏览变更成为可能,他本人也借此分析了 Opus 4.6 到 4.7 的提示词变化。
Skills 功能允许用户在 Chrome 中保存和复用 AI 提示词,简化重复性任务。用户可创建自定义工作流,或从官方库中直接添加预设技能。功能基于 Chrome 的安全架构,需要用户确认敏感操作。
作者在 Claude Code 中测试了五种不同的安全审计提示词(Skills/Prompts),对比了它们在发现 SQL 注入、XSS 等漏洞上的效果。实测发现,不同提示词在准确性、覆盖面和误报率上表现不一,选择合适的提示词对安全审计至关重要。
本文通过‘画一只猫’的比喻,阐述了提示工程的核心在于减少输出方差。介绍了系统指令的权重层级,并详细解析了少样本提示、思维链提示、角色提示和工具增强提示四大模式。最后强调评估和验证的重要性。
Anthropic 取消了 Claude Opus 4.6 和 Sonnet 4.6 的长上下文定价附加费,使百万 token 上下文窗口按标准 token 费率计费。这一变化可能影响应用设计,让开发者更自由地发送大型数据集到模型,简化工作流。
文章介绍了作者在智能体工程中常用的三个提示模板:利用 Claude 的 Artifacts 功能快速构建 HTML 工具原型,使用 LLM 校对博客文本但不代写观点内容,以及用 Claude Opus 生成图像替代文本初稿。每个模板都配有具体的自定义指令示例。
文章分析了 AI 智能体面临的提示注入攻击如何演变为社交工程,强调防御需限制操作影响而非仅检测恶意输入。OpenAI 在 ChatGPT 中采用源-汇分析和 Safe Url 等机制,在敏感信息外传前介入用户确认,借鉴了人类客服的风险管控思路。
OpenAI 收购 Promptfoo 以增强其企业 AI 平台 Frontier 的安全测试功能,包括自动化安全测试、开发工作流集成以及监管追溯能力。Promptfoo 的开源项目将继续维护,团队将加入 OpenAI 加速 AI 安全工具开发。
攻击者利用 Cline 仓库中配置的 AI Issue 分诊工作流,通过精心构造的 Issue 标题进行提示注入,诱使 Claude Code 执行恶意 npm install 命令。随后利用 GitHub Actions 缓存共享机制,实施缓存投毒攻击,窃取了 NPM 发布密钥并发布了被篡改的 cline@2.3.0 版本。Cline 在收到漏洞报告后未能及时处理,导致攻击发生。
文章汇总了 2026 年 2 月 4 日的 AI 编程新闻,包括 Claude Code 的 10 个技巧、Opus 与 Sonnet 模型对比、Codex 应用发布,以及多项功能更新如多仓库支持、自定义快捷键等。
本文分析了提示注入攻击的成因:LLM 输入中指令与数据未分离,且模型被训练为遵循输入中的任何指令。提出的防御方案包括安全前端(Secure Front-End)分隔输入、结构化指令调优(StruQ)模拟注入训练,以及特殊偏好优化(SecAlign)通过偏好优化增强鲁棒性。实验显示,SecAlign 在保持模型通用能力的同时,将优化攻击成功率降低至 15% 以下。