资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

首例AI勒索攻击：人类依然不可或缺

Sysdig披露的JadePuffer攻击是首例已知由AI代理执行技术操作的真实勒索软件攻击，但人类仍深度参与：选择目标、搭建C2服务器、提供凭证。攻击者利用Langflow漏洞入侵，加密超1300条配置记录，并自主生成勒索信。攻击速度快、透明度高，但所用模型未知。

深度·7月6日·4 分钟

北大研究：AI编码助手并未挤出开源新人，但维护者压力飙升

北京大学对1888个GitHub仓库的研究显示，AI编码助手并未挤出开源项目的新人，但维护者的工作量显著增加，PR数量翻近四倍，代码复杂度小幅上升。

深度The New Stack·7月6日·5 分钟

Vercel CEO：模型与智能体的“拆伙”之战

Vercel CEO Guillermo Rauch 接受 TechCrunch 采访，讨论了智能体在生产环境中的现实挑战：数据安全、审计追踪、工具调用权限。他提出模型与智能体应解耦，Vercel 的 Eve 框架和 Sandbox 产品旨在提供灵活的“插拔”架构。同时他观察到，谷歌 Gemini、DeepSeek 等模型因性价比而崛起，客户正从单一模型合作伙伴转向多模型策略。

深度·7月6日·6 分钟

JetBrains实测：穴居人模式只省8.5% token

开发者试图通过“穴居人模式”让AI用最简短的回应来节省token，但JetBrains的基准测试表明，在真实的编程任务中，token节省仅约8.5%，而非宣称的65%。不过，该技能对任务质量没有负面影响。

深度The New Stack·7月6日·5 分钟

Karpathy、Google、YC总裁一致押注Markdown，智能体记忆的答案

Karpathy、Google 和 Garry Tan 在今年第二季度都选择用 Markdown 文件作为智能体的记忆载体。三者的出发点不同——个人知识库、企业上下文、工程师团队——但解决方案一致：一个用 git 版本管理的 Markdown 文件夹。这标志着智能体的竞争优势正从模型转向团队长期积累的文档资产。

深度The New Stack·7月6日·4 分钟

Fable 系统在 KernelBench-Mega 上编写了首个真正的 megakernel，速度提升 18.71 倍，预示 AI 研发自动化临近；Remote Labor Index 显示 AI 对在线项目自动化成功率已升至 16.1%，且增长迅速；OSWORLD 2.0 推出更复杂的计算机操作基准，任务中位数耗时 1.6 小时，当前最强 AI 仅达 20.6%；京东公布 Oxygen AIIC 系统，用深度学习管理数十亿 SKU 的库存。

深度·7月6日·4 分钟

微软、AWS 砸数十亿，不是为模型而是为部署

微软、AWS、Anthropic 和 OpenAI 纷纷建立嵌入式工程团队，帮助客户部署 AI。模型质量差距缩小，部署和客户粘性成为竞争关键。企业采购时应关注系统所有权和退出成本。

深度The New Stack·7月5日·7 分钟

Simon Willison 用 Claude Fable 重构 sqlite-utils，花约 150 美元

Simon Willison 用 Claude Fable 对 sqlite-utils 4.0rc1 进行全面审查，修复了 `delete_where()` 不提交事务导致数据丢失等严重问题。他用 GPT-5.5 交叉验证，又发现了两个边界 bug。整个项目花费约 149.25 美元（按非订阅价估算），但他庆幸自己有 Max 订阅。

教程Simon Willison·7月5日·8 分钟

Opus 4.8 工具调用反不如旧模型

新版 Claude 模型在调用 Pi 的 edit 工具时，会在嵌套的 edits 数组中凭空捏造大量额外键（如 requireUnique、oldText2 等），导致工具调用失败。作者分析认为，这是由于模型在后训练中过度适应了 Claude Code 的扁平编辑工具 schema，遇到不同形状的工具时更易生成不符合 schema 的调用。开启 strict 模式可解决，但显示了后训练对模型行为的深刻影响。

深度·7月4日·12 分钟

阿里巴巴7月10日起内部禁用Claude Code

阿里巴巴报告将禁止员工使用 Anthropic 的 Claude Code 编程工具，自7月10日起生效。该工具被列为高风险软件，员工将被要求使用阿里自研的 Qoder 替代。此前 Anthropic 已禁止中国公司使用其模型，并曾通过实验性代码识别中国用户以防止滥用。

深度·7月4日·2 分钟

省钱别只盯着模型，token消耗才是大头

随着智能体式AI规模化，token消耗——而非模型选择——正成为真正的成本驱动因素，团队应转向更智能的上下文管理和路由。

深度The New Stack·7月4日·5 分钟

Safari 变成 AI 代理可操控的浏览器

苹果为 Safari 推出了内置 MCP 服务器，提供 16 个工具让 AI 代理直接控制浏览器。这是苹果一个月内发布的第二个官方 MCP 服务器，表明 MCP 正成为平台标准基础设施。

深度The New Stack·7月3日·4 分钟

Vercel 首席软件官谈 Agent：一种新形态的软件

Vercel 首席软件官 Andrew Qu 在访谈中阐述了 Agent 作为一种新软件形态的独特需求，并分享了 Vercel 从构建内部 Agent 到推出框架 eve 的历程。他强调了 Skills 在知识校正、Sandbox 在安全执行中的作用，并预测未来网站需要为 Agent 提供机器可读的界面。

深度Latent Space·7月3日·6 分钟

Zuckerberg坦言AI智能体进展不如预期

Zuckerberg在内部会议上承认AI智能体进展慢于预期，认为AI团队重组的效果尚未落地，但预计未来3-6个月会看到改善。

深度·7月2日·2 分钟

Adobe 演示“智能体网站”：页面实时生成，每人看到不同内容

Adobe 正在实验“智能体网站”——根据访客意图实时生成个性化页面。主科学家 Carlos Sanchez 在 AIEWF 上演示了该原型，称推理成本仅 1-2 美分/页，适合电商等场景，但尚未大规模商用。

深度Latent Space·7月2日·5 分钟

Simon Willison 的 LLM 编码 Agent 实验

作者基于 LLM 库构建了一个简单的编码 Agent，实现了文件编辑、命令执行、文件搜索等工具，并通过 CLI 和 Python API 提供交互。实验展示了 Agent 自动生成代码的能力。

教程Simon Willison·7月2日·4 分钟

DSPy 优化 Datasette Agent 的 SQL 提示词

使用 DSPy 框架评估和优化 Datasette Agent 的 SQL 回答系统提示词。方法包括构建测试框架、生成自动评估数据集、运行优化循环，并发现了多个改进方向。

教程Simon Willison·7月2日·3 分钟

Impeccable 创始人：AI 设计不能一键完成，技能工程才是出路

Paul Bakaus 详解 Impeccable 技能系统：通过给 Agent 注入专业术语与领域知识，实现可控的界面优化。他强调 AI 应负责前 80% 的平庸工作，人的审美和判断力决定最终 20%。

深度Latent Space·7月2日·6 分钟

资讯

首例AI勒索攻击：人类依然不可或缺

北大研究：AI编码助手并未挤出开源新人，但维护者压力飙升

Vercel CEO：模型与智能体的“拆伙”之战

JetBrains实测：穴居人模式只省8.5% token

Karpathy、Google、YC总裁一致押注Markdown，智能体记忆的答案

AI写GPU内核提速18倍，自动化正加速渗透经济

微软、AWS 砸数十亿，不是为模型而是为部署

Simon Willison 用 Claude Fable 重构 sqlite-utils，花约 150 美元

Opus 4.8 工具调用反不如旧模型

阿里巴巴7月10日起内部禁用Claude Code

省钱别只盯着模型，token消耗才是大头

Safari 变成 AI 代理可操控的浏览器

Vercel 首席软件官谈 Agent：一种新形态的软件

Zuckerberg坦言AI智能体进展不如预期

Adobe 演示“智能体网站”：页面实时生成，每人看到不同内容

Simon Willison 的 LLM 编码 Agent 实验

DSPy 优化 Datasette Agent 的 SQL 提示词

Impeccable 创始人：AI 设计不能一键完成，技能工程才是出路

首例AI勒索攻击：人类依然不可或缺

北大研究：AI编码助手并未挤出开源新人，但维护者压力飙升

Vercel CEO：模型与智能体的“拆伙”之战

JetBrains实测：穴居人模式只省8.5% token

Karpathy、Google、YC总裁一致押注Markdown，智能体记忆的答案

AI写GPU内核提速18倍，自动化正加速渗透经济

微软、AWS 砸数十亿，不是为模型而是为部署

Simon Willison 用 Claude Fable 重构 sqlite-utils，花约 150 美元

Opus 4.8 工具调用反不如旧模型

阿里巴巴7月10日起内部禁用Claude Code

省钱别只盯着模型，token消耗才是大头

Safari 变成 AI 代理可操控的浏览器

Vercel 首席软件官谈 Agent：一种新形态的软件

Zuckerberg坦言AI智能体进展不如预期

Adobe 演示“智能体网站”：页面实时生成，每人看到不同内容

Simon Willison 的 LLM 编码 Agent 实验

DSPy 优化 Datasette Agent 的 SQL 提示词

Impeccable 创始人：AI 设计不能一键完成，技能工程才是出路