资讯
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
Vercel 发布开源框架 eve,将 agent 视为文件目录,支持 MCP、子 agent、人工审批和 OpenTelemetry 追踪。内部已有 100+ agent 运行,平台 29% 的部署由 agent 触发。
Block 在其开源框架 Goose 之上构建了 BuilderBot,通过 Slack 的 @builderbot 标签管理 AI 编码代理集群。系统可跨仓库工作,处理 Linear/Jira 工单、创建分支、提 PR、监控 CI 并迭代反馈。目前每天执行 20 万次操作,每周合并约 1500 个 PR,将原本数月的工作缩短至数天。
Chainguard 升级 Agent Skills,提供超 1000 个硬化社区技能、私有注册表及定制硬化服务。支持 Claude Code、Cursor 等工具,通过持续流水线确保技能安全,并为企业内部技能提供版本管理和访问控制。
Tailscale 升级 Aperture 平台,新增聊天界面、MCP 和 API 数据连接器以及沙箱支持,旨在为企业提供基于身份的 AI 访问控制和编排层。CEO 强调“代理需要无聊的基础设施”,即稳健的身份管理、有限访问控制、详细日志和沙箱。
Cloudflare 发布了 Cloudflare One Stack,这是一组 Agent Skills,可让 AI 代理解读并自动化零信任环境的搭建、迁移和运维。该工具包基于 Cloudflare 数千次客户迁移经验,包含产品配置、供应商迁移、网络图分析等能力,并支持与 Cloudflare API 对接。
Strands Robots SDK 将 LeRobot 的演示录制、策略推理等功能封装为 AgentTools,开发者可在一个代理内完成从模拟录制、数据集上传、策略运行到实体机器人部署的全流程。模拟与硬件共享同一数据集格式,代码只需修改一个参数即可切换环境。
ARD 规范定义了静态清单和动态注册 API,让 Agent 通过自然语言搜索发现工具和技能。Hugging Face 的 Discover Tool 是其参考实现,支持搜索 MCP 服务器、技能等资源。开发者可通过 CLI 或 REST API 使用。
DeepMind 发布 AI 控制路线图,基于“纵深防御”理念,将不完美对齐的智能体视为内部威胁,通过威胁建模、异步/同步监控和分级响应机制保障安全。框架已用于分析百万级编码智能体轨迹,并应用于 Gemini Spark 等实际系统。
AWS FinOps Agent 进入公开预览,可通过自然语言查询成本、自动调查异常并创建 Jira 工单或 Slack 通知。权限以只读为主,构建于 Bedrock 之上,目前仅在美国东部区域可用。
Anthropic 暂停了 Claude Agent SDK 的计费变更,该变更原定于 6 月 15 日生效,旨在将 Agent SDK 使用量从通用订阅额度中分离出来并单独计费。此举是在美国政府要求 Anthropic 撤下 Fable 5 和 Mythos 5 模型之后做出的,意在安抚开发者群体。
Datasette Agent 0.3a0 引入 `execute_write_sql` 工具,写入操作需用户批准;CLI 模式新增 `--yes` 和 `--unsafe` 选项,支持自动批准。
NewCore获得6600万美元种子轮融资,估值3亿美元,为AI代理提供身份管理方案。平台采用“拆分密钥”架构,支持人类与AI代理的统一身份管控,并已与多家企业合作测试。
传统日志已无法应对 AI 代理自主行动带来的审计挑战。文章对比了表面日志与完整审计记录的差异,解释了监管压力、AI 安全威胁如何推动日志需求升级,并指出良好的审计日志已直接关联企业收入和销售周期。
Bottega是一个开源的多执行框架(Harness)智能体编排工具,支持Claude Code、Codex和OpenCode。它强调以规划为中心,通过详细的计划模板、自动化实施和对抗性代码审查,减少了PR阶段的来回迭代,提升了代码质量。
Stack Overflow 发布 Stack Overflow for Agents,一个专为 AI 编码 Agent 设计的 API-first 知识共享平台。平台支持 Agent 自主查询和提交问题,但所有内容需经人类审核后发布,并绑定开发者声誉来实现问责。意图解决 Agent 在孤立环境中重复发现相同解决方案的“短暂性智能差距”问题。
lakeFS发布Agentic AI服务,为每个代理提供独立的零拷贝数据沙箱,通过分支级凭证和策略门控确保生产数据安全,并提供统一审计追踪。这是应对代理自主操作导致数据损坏风险的关键基础设施。
Sarah Guo 的文章提出一个框架,区分了模型能力(可训练/可基准测试)与应用价值(不可训练/需深度集成)。她强调,真正的竞争壁垒来自“不可训练”的领域:客户现场集成、领域专业知识、以及判断该构建什么的能力。这也呼应了 Latent Space 此前关于开源模型、智能体实验室 vs 模型实验室的讨论。
Datasette Agent 0.2a0 引入 `ask_user()` 方法,允许工具在执行时向用户提问,支持暂停执行并持久化到数据库,服务器重启后恢复。同时新增 `save_query` 工具,可保存 SQL 查询,但需人工审批。