资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

Claude Sonnet 5 发布：更便宜的智能体模型

Anthropic 推出 Claude Sonnet 5，价格更低但智能体能力接近 Opus 4.8，旨在成为运行自主任务的经济选择。该模型在推理、工具使用和编码方面相比前代显著提升，同时安全性能更优，将于周二起作为免费和 Pro 计划的默认模型。

深度·6月30日·4 分钟

Acti 把 AI 智能体塞进手机键盘

Acti 将 AI 智能体直接集成到手机键盘中，支持跨应用操作。用户可以用自然语言创建自定义技能（Skills），一键触发多步骤任务。App 采用本地优先架构保护隐私，由 Google Gemini 模型驱动，已获 530 万美元种子轮融资。

指南·6月30日·4 分钟

Anthropic 推 Claude Science，用工作流而非新模型抢滩科研市场

Claude Science 是一个 AI 工作台，整合 60+ 数据库和预置工具包，支持子智能体协作、代码可复现与事实核查，运行在现有 Claude 模型上。Anthropic 以此押注垂直工作流，与 OpenAI 的专用模型策略和 Google 的自有模型策略形成差异化竞争。

深度·6月30日·5 分钟

shot-scraper 1.10 发布：用 YAML 脚本录制视频演示

shot-scraper video 命令通过 storyboard.yml 定义操作步骤，结合 Playwright 录制视频演示。文章展示了如何用该命令为 Datasette 的批量插入功能录制演示视频，并分享了开发过程中 Playwright screencast 机制的演进。

教程Simon Willison·6月30日·7 分钟

AWS 给 AI Agent 配上专属云桌面

AWS 发布 Amazon WorkSpaces for Agents 正式版，为 AI Agent 提供专属云桌面，使其能操作无 API 的遗留应用。基于 MCP 协议和计算机视觉，Agent 可读写文件、操控 GUI，并支持人工监控与干预。企业可通过 Active Directory 为 Agent 赋予身份和权限。

深度The New Stack·6月30日·4 分钟

X 推出官方 MCP 服务器，AI 工具可直连平台数据

X 发布了官方的托管 MCP 服务器，简化了 AI 工具与 X API 的连接。开发者可以省去自建 MCP 服务器的麻烦，直接利用 X 的实时数据进行搜索和分析。该工具只提供读取权限，不支持自动发帖，且仍受 X API 使用条款约束。

指南·6月30日·3 分钟

Harness 发布 Autonomous Worker Agents：用 AI 替换生产线中的固定脚本

Harness 发布 Autonomous Worker Agents，支持在投产管线中用 AI Agent 替代固定脚本，并保持治理与安全控制。Agent 以 Markdown 文件定义，运行在客户基础设施内，自带沙箱、身份权限和成本控制。Harness 还推出 Agent Marketplace，提供预置 Agent 分三层：官方托管、合作伙伴认证和社区开源。

深度The New Stack·6月30日·5 分钟

AWS 10亿美金组建AI部署工程师团队

AWS成立新的前部署工程师（FDE）组织，投入10亿美元资源。工程师将嵌入客户公司部署AI智能体，注重快速交付和客户自给自足。OpenAI和Anthropic此前已推出类似合资项目。

深度·6月30日·3 分钟

OKX 打造 AI 代理市场，让代理互相雇佣支付

OKX 推出 AI 代理市场，支持代理间自主雇佣、支付和声誉建立。平台基于区块链和稳定币，适用于微支付场景。早期合作伙伴包括 CertiK 和 GenLayer。OKX 认为“代理经济”将成为万亿级市场。

深度·6月30日·5 分钟

Base44 自研模型，AI 初创公司的护城河焦虑

Base44 发布自研模型 Base1，基于平台数千万用户交互数据训练，旨在优化延迟、成本和效率。创始人认为垂直整合是护城河，但 VC 提醒不要低估前沿模型。公司 ARR 已超 1.5 亿美元，但仍落后于竞争对手 Lovable。

深度·6月30日·5 分钟

Ornith-1.0：开源编程智能体模型，自搭建执行框架

Ornith-1.0 是 DeepReinforce 发布的首个开源模型，采用 MIT 许可，基于 Gemma 4 和 Qwen 3.5 训练。它能自主搭建执行框架，在编程基准测试中表现优异。Simon Willison 用 LM Studio 运行了 35B GGUF 版本，发现它能高效处理多工具调用任务。

深度Simon Willison·6月29日·3 分钟

NVIDIA 机器人自改进框架；腾讯万卡集群；人类预言屡错

NVIDIA 的 ENPIRE 框架让真实机器人通过自主试错实现自我改进，在简单任务上达到 99% 成功率。腾讯的 ARGUS 系统在超 1 万 GPU 集群上稳定运行半年，用于诊断训练问题。此外，一篇论文指出人类历史上对技术影响的预测屡次失误，对 AI 的乐观或悲观都应谨慎。

深度·6月29日·8 分钟

Workday CTO：AI护栏应嵌入推理引擎

Workday 推出 Agent-Ready Tools、Developer Agent 和 Agent Passport 等工具，旨在让 AI 智能体在 HR 和财务数据上安全运行。CTO 强调护栏应嵌入推理层，并主张智能体编排应靠近数据源。

深度The New Stack·6月28日·5 分钟

亚洲AI推出类Mythos模型，美国出口禁令持续

美国出口禁令持续，亚洲AI公司推出竞品：360的“屠龙风”对标Mythos，Sakana AI的Fugu模型具备前沿能力且无出口管制风险。尽管美国模型仍受重视，但本地化替代品正在崛起。

深度·6月27日·5 分钟

AI蠕虫：低成本、自适应，网络安全新威胁

研究团队利用开源小模型，在实验中构建了一款AI驱动的自适应计算机蠕虫，它能自主识别目标漏洞、自我复制并利用受害设备资源持续攻击。该蠕虫不依赖商业AI平台，成本几乎为零，标志着自主网络攻击从理论走向现实。

深度·6月26日·8 分钟

20家巨头联合成立Akrites，用AI修复开源漏洞

Akrites由Linux基金会托管，通过共享安全响应团队协调漏洞修复，避免重复报告和泄露风险。种子资金来自Alpha-Omega，年预算超700万美元。

深度The New Stack·6月26日·4 分钟

OpenAI、SpaceX 自研芯片，英伟达一家独大局面将终结？

TechCrunch 的 Equity 播客探讨了从 OpenAI 到 SpaceX 等公司自研芯片的趋势，分析其对行业的影响，并讨论了本周值得关注的几笔交易，包括一家人形机器人公司准备测试公开市场。

深度·6月26日·4 分钟

GPT-5.6三款模型亮相：Sol旗舰、Terra平价、Luna低价

OpenAI 开始限量预览 GPT-5.6 系列，包括 Sol、Terra 和 Luna 三款模型。Terra 在性能上与 GPT-5.5 持平，价格降低 50%；Luna 为最经济选择。新系列引入更可预测的提示缓存机制，支持显式缓存断点和 30 分钟最小缓存寿命。

深度Simon Willison·6月26日·2 分钟