资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 581 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 581 篇文章
GitHub Copilot 因智能体工作流导致计算需求激增,暂停个人版新注册并收紧使用限制,包括会话和每周 token 上限。Pro+ 计划提供超过 Pro 计划 5 倍的限制,Opus 模型仅限 Pro+ 使用。VS Code 和 Copilot CLI 新增用量显示功能,帮助用户避免超限。
Cloudflare 在 Agents Week 2026 上推出了面向智能体(Agent)的完整基础设施栈,涵盖计算环境、安全工具和智能体工具箱。这些更新包括 Artifacts 存储、Sandboxes 隔离环境、Cloudflare Mesh 私有网络等,旨在支持大规模智能体部署。
华为 HiFloat4 格式在昇腾芯片上训练大语言模型时,其相对损失误差(≈1.0%)低于 MXFP4(≈1.5%)。Anthropic 利用自动化对齐研究员(AAR)在弱到强监督任务上,以约 18,000 美元的成本,实现了 0.97 的性能差距恢复率(PGR),远超人类基准。
GRASP 是一种新的梯度规划器,针对学习型世界模型的长时域规划问题,通过并行化优化、添加随机性和重塑梯度来提升稳定性和效率。文章分析了长时域规划中梯度爆炸/消失、非贪婪陷阱以及高维状态输入梯度敏感等核心挑战,并介绍了 GRASP 的解决方案。
Claude Token Counter 工具新增模型对比功能,支持 Opus 4.7、4.6、Sonnet 4.6 和 Haiku 4.5。Opus 4.7 的 tokenizer 更新使文本 token 数增加约 1.46 倍,高分辨率图像处理能力提升导致 token 消耗最高达 3 倍,但低分辨率图像和 PDF 的差异较小。
这篇文章梳理了 Claude Code 中被归为 CVE-2026-35022 的三处高危命令注入问题,影响 CLI 0.2.87 和 Claude Code 2.1.87。给出的直接建议很明确:立刻升级、停用 authentication helpers、改为直接设置 ANTHROPIC_API_KEY,并且不要在 CI/CD 里对不受信任的 PR 运行这个 CLI。
Claude Opus 4.7 的系统提示词在工具列表、儿童安全、对话风格等方面都有更新。作者用 Claude Code 分析了两个版本的差异,还列出了 Claude 可用的工具清单。
这篇文章拆解了几家头部厂商在 Agent 执行框架上的产品路线和收费方式。作者的核心判断是:大家都认同这一层很重要,但商业模式还远没收敛,这也让创业公司和自建平台团队的处境一下变了。
Claude Mythos 确实发现了真实漏洞,但媒体报道严重偏离事实。漏洞发现依赖多智能体管道而非纯模型能力,且更小更便宜的模型也能复现部分结果。此次发布与 Anthropic 的 IPO 计划紧密相关,存在明显的叙事操控。
Simon Willison 将 Anthropic 公开的 Claude 系统提示词 Markdown 页面,用 Claude Code 处理成按模型和家族分开的文件,并赋予假的 Git 提交日期。这使得在 GitHub 提交视图中浏览变更成为可能,他本人也借此分析了 Opus 4.6 到 4.7 的提示词变化。
作者认为,Google 和 OpenAI 终于开始认真做桌面 AI,而且节奏已经追上 Anthropic。与此同时,Anthropic 在模型发布、产品稳定性、Token 消耗和用户摩擦上连续失分,原本靠体验守住的桌面优势开始松动。
Cursor 新一轮融资规模或超 20 亿美元,估值将翻倍至 500 亿美元。公司预计 2026 年底年化收入超 60 亿美元,并已通过自研 Composer 模型实现微薄毛利。
文章记录了 GitHub 团队在直播中如何使用 GitHub Copilot CLI 的规划模式(Plan Mode)和自动模式(Autopilot Mode),结合 OpenTUI、GitHub Copilot SDK 和 clipboardy 等工具,快速开发出一个终端表情符号列表生成器。项目开源,展示了多模型工作流和工具调用(Tool Use)的实际应用。
Claude Design 是 Anthropic 推出的设计工具,可基于代码库或设计文件生成设计系统,并允许用户实时调整元素。它支持导出为 PDF、PPT 或 HTML,并能与 Canva 或 Claude Code 集成。不过,其 token 消耗较高,且目前处于研究预览阶段。
文章讨论了 AI 行业圈内与圈外差距的扩大,OpenAI 的收购狂潮,以及 Anthropic 的模型策略。播客还涵盖了芯片投资、数据中心初创公司和 Claude Code 在会议上的表现等话题。
这部分主要讲两件事:一是 Cloudflare 为什么要做 Agent Readiness 评分,以及它如何衡量网站是否适合 Agent 使用;二是当前 Web 在相关标准上的采用情况。文中还拆解了评分的几大维度,包括可发现性、内容可访问性、Bot 访问控制和能力声明,并解释了这些检查为什么重要。
共享字典压缩利用浏览器缓存作为字典,服务器仅传输文件差异,大幅降低重复下载。智能体流量增长和频繁部署导致传统缓存失效,此技术可优化版本化资源如 JS 包和 CSS 文件。
Unweight 是 Cloudflare 开发的 LLM 权重无损压缩系统,通过 Huffman 编码压缩指数字节,在 H100 GPU 上实现 15-22% 的模型体积缩减。系统提供四种执行流水线,根据工作负载动态选择最优解压策略,减少内存带宽压力,提升推理效率。