资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

模型审核困局：Anthropic 与 OpenAI 同陷政策泥潭

美国政府收紧 AI 模型发布控制，对 Anthropic 和 OpenAI 都实施逐客户审批，行业面临不确定的监管风险。文章呼吁行业放弃内斗，寻求集体共识与合理的审批流程。

深度·6月26日·4 分钟

云巨头统一转向“会话级隔离”架构

AWS、微软、Google 和 Anthropic 的智能体运行时均转向会话感知执行，用会话级隔离取代请求级负载均衡。这一变化源于智能体的长运行、有状态、执行不可信代码的特性。四家厂商在架构上趋同，但实现载体各异：AWS 用 Firecracker 微VM，Azure 用 VM 隔离沙箱，Google 采用混合架构，Anthropic 则将执行环境解耦为可替换层。

深度The New Stack·6月26日·10 分钟

OpenAI 自研芯片 Jalapeño，大厂集体“去 Nvidia”化

OpenAI 推出自研推理芯片 Jalapeño，加入大厂去 Nvidia 依赖浪潮。本期 Equity 播客还探讨了 Groq 融资、AI Agent 循环、人形机器人上市及 Google DeepMind 与 A24 合作等话题。

深度·6月26日·4 分钟

Shopify 用 LLM 替商品“找亲戚”，零售商们慌了

Shopify 推出 Catalog 系统，利用 LLM 组织商品数据，帮助 AI 购物代理识别和比较相同商品。此举背景是 AI 驱动的流量和订单大幅增长，零售商正加速调整商品信息策略以适配 AI 代理。

深度The New Stack·6月26日·4 分钟

一条命令在HF上跑vLLM服务器

通过 Hugging Face CLI 的 `hf jobs run` 命令，开发者可以一条命令启动 vLLM 推理服务器，支持 GPU 硬件选择、端口暴露、按秒计费。服务器启动后可通过 OpenAI API 兼容协议远程调用，适合实验、评估和批量生成场景。文章还介绍了扩展到更大模型、Gradio UI 聊天、SSH 调试以及与 Pi 编程智能体集成的进阶用法。

指南Hugging Face·6月26日·12 分钟

Agent测试公司Patronus AI获5000万美元融资

Patronus AI通过构建模拟数字环境，对AI智能体进行压力测试，确保其在复杂任务中可靠运行。公司营收一年增长15倍，获5000万美元B轮融资，总融资7000万美元。

深度·6月25日·4 分钟

2.3B美元押注：游戏数据训练真实世界智能体

General Intuition 获得3.2亿美元融资，估值23亿美元，计划用数亿小时游戏操作数据训练通用智能体，实现从虚拟到现实的无缝迁移。公司已展示四足机器人、世界模型等demo，但规模化落地仍是未知数。

深度·6月25日·8 分钟

AWS 智能体工具包：20+ 技能，少一个文件就不起作用

Agent Toolkit for AWS 包含三层：MCP 服务器、技能和规则文件。规则文件是关键，它告诉智能体优先使用 MCP 服务器和技能，而非依赖训练数据。作者实例表明，添加规则后，智能体给出的架构建议更具体、更可靠。

指南The New Stack·6月25日·6 分钟

独立开发者实测 Mythos 安全漏洞检测能力

独立开发者 Joe Cooper 基于 Anthropic 自身文档构建了安全漏洞检测基准测试，评估 Mythos 在无提示场景下发现复杂跨文件漏洞的能力。结果表明 Mythos 确实发现了其他模型未能找到的 4 个漏洞，但整体结论是“可能”。安全专家提醒，原始能力领先不等于能成为安全领域的万能药，正确的框架和运行时上下文同样重要。

深度The New Stack·6月24日·6 分钟

Databricks 联合创始人谈智能体云与开放生态

Databricks 正在构建企业智能体的操作系统，其核心是开源元执行框架 Omnigent，可组合多种编码和自定义智能体。与此同时，LTAP 架构统一了事务和分析存储层，为智能体提供实时操作上下文。

深度Latent Space·6月24日·6 分钟

Gemini 3.5 Flash 内置电脑操控，Agent 能力再升级

Gemini 3.5 Flash 现在原生支持电脑操控，开发者可通过 API 和 Agent 平台构建跨平台智能体。为应对安全风险，模型采用了对抗训练，并推出了可选的企业级防护系统。

深度·6月24日·3 分钟

OpenAI 发布首款自研推理芯片 Jalapeño

OpenAI 发布了首款自研推理芯片 Jalapeño，由 Broadcom 制造。该芯片专为推理任务优化，能效比优于现有方案，旨在降低运行成本。OpenAI 的自研 AI 模型也参与了芯片开发。

深度·6月24日·3 分钟

Sakana Fugu 评测：多智能体编排系统并非 AI 主权救星

Sakana AI 的 Fugu 通过将任务分解并路由至可切换的专家模型池，试图达到前沿模型水平。早期用户评价不一，部分用户认为其性能优于某些模型，但更多人批评其价格昂贵、速度慢、质量不稳定。Fugu 被宣传为 AI 主权的蓝图，但实际依赖第三方模型，未能真正解决供应商锁定问题。

深度The New Stack·6月24日·8 分钟

Claude Tag：Slack里的异步智能体队友

Anthropic 推出 Claude Tag，将 Claude 深度集成到 Slack 中，支持异步委托、跨频道协同、代码库接入和自动化工作流。产品处于 beta 阶段，面向 Claude Enterprise 和 Team 用户。

深度Latent Space·6月24日·6 分钟

Anthropic 让 Claude 常驻 Slack 频道

Anthropic 推出 Claude Tag，将 Claude 嵌入 Slack 作为永久、共享的团队成员。Claude 拥有自己的身份和权限，可以跨频道工作，支持多人协作，并允许管理员设置 token 消费上限。

深度The New Stack·6月23日·4 分钟

OpenClaw vs Hermes：智能体控制权之争

OpenClaw与Hermes Agent代表了两种智能体执行框架设计路线：OpenClaw以网关为中心，连接众多消息渠道，吸引平台厂商（Nvidia、Microsoft）为其添加治理和身份层；Hermes以内存为中心，实现跨会话的持久化学习，支持模型切换和技能进步。企业用户需权衡治理、身份和控制权，而平台厂商正围绕运行时层展开竞争。

深度The New Stack·6月23日·10 分钟

Claude Tag 潜入 Slack，读懂你的团队

Claude Tag 是 Anthropic 为 Slack 推出的 AI 队友，具备持久上下文和记忆能力。它能跟踪频道对话、自动从其他频道收集信息，并在闲时主动介入。这背后是 Anthropic 对企业知识图谱的争夺。

深度·6月23日·4 分钟

Nx 推出 Polygraph，让 AI 编码 Agent 不再卡在跨仓库

Nx 推出 Polygraph，将多个仓库连接成“合成单仓库”，并附带跨会话的共享记忆，让 AI 编码 Agent 能无缝处理跨仓库变更。目前处于免费早期访问阶段，支持 Claude Code、Codex 等 Agent。

深度The New Stack·6月23日·5 分钟