资讯
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
Google I/O 2026的主题是智能体Gemini时代。月处理token数增长7倍至3.2千万亿,850万开发者月活。新发布Gemini Omni模型、Ask YouTube、Docs Live等功能。TPU 8t和8i芯片分别针对训练和推理优化,400亿美元年capex支撑基础设施。
Anthropic 推出自托管沙箱和 MCP 隧道,为企业提供安全、私密的 AI Agent 基础设施。沙箱让 Agent 在客户或服务商的基础设施上执行工具,MCP 隧道则让 Agent 安全连接私有网络,无需公网暴露。Clay、Rogo、DoorDash 等客户已在实际场景中使用 Claude Managed Agents。
Cloudflare 与 Anthropic 合作推出 Claude Managed Agents 集成,让开发者利用 Cloudflare Sandboxes 作为 Agent 的执行环境。该方案提供可定制的代理、私有服务连接、浏览器控制、隔离沙箱以及基于 V8 isolate 的轻量级沙箱选项,适合大规模 Agent 部署。
Gas Town 由 Kilo 提供云托管,降低了自建基础设施的运维负担;Wasteland 作为联邦信任网络,允许开发者和智能体通过 Dolt 和 Git 系统发布任务、认领工作并验证贡献。Yegge 还透露了下一个项目 Gas City,旨在构建更灵活的组织层级与编排系统。
Pulumi发布多项新功能,旨在让AI Agent无需人工干预即可完成基础设施管理。包括临时账户、一键CLI工具、新的`pulumi do`命令,以及Neo与监控、告警等工具的集成。Duffy指出,大型语言模型更熟悉通用编程语言而非HCL,这使Pulumi的优势凸显。一个医疗客户曾通过Neo发现了40万条合规违规。
Simon Willison 在 PyCon US 2026 闪电演讲中总结了 LLM 领域过去六个月的关键变化:最佳模型多次易主,编码 Agent 在 2025 年 11 月后从“偶尔能用”跨入“日常可用”,开源本地模型(如 Gemma 4、Qwen3.6-35B-A3B)表现惊喜,OpenClaw 等个人 AI 助手成为新焦点。
Together AI 针对编码智能体工作负载(长输入、高并发)进行了推理基准测试,结果优于 TensorRT-LLM 和 SGLang。其引擎在 2.5M TPM 负载下 TPS 高 31%,TTFT 仅 0.71 秒(TensorRT-LLM 为 1.1 秒)。搭配 Kimi K2.6 模型,单次请求成本仅 $0.108,比 Claude Opus 4.6 便宜 76%,且编码基准测试性能持平或更优。
GitHub Copilot 远程控制功能现已全面可用,开发者可在 VS Code、CLI 中启动会话后,通过 github.com 或 GitHub Mobile 实时监控 Agent 进度、发送额外指令、审批权限请求,并完成从计划到合并 PR 的完整工作流,支持多设备无缝切换。
IBM Research 发布开放智能体排行榜,评测完整 Agent 系统而非单一模型,覆盖六个跨领域基准测试,同时报告成功率和成本。初步发现:通用 Agent 已能与专用系统匹敌,相同模型搭配不同 Agent 设计结果差异显著,工具排序机制能普遍提升性能。
GitHub 开发了一个通用无障碍代理,通过子代理架构自动审查 PR 并修复无障碍问题。文章分享了经验教训,包括使用结构化问题库、子代理分工、Token 消耗优化等,强调代理不能替代人工投入,而是辅助工具。
Conductor 推出 Conductor Cloud,将 AI 编码代理从本地 Mac 应用迁移到托管云环境中运行。该公司认为,随着代理数量增加,管理多个代理成为界面挑战,云化是必然方向。Anthropic、Mistral 和 Roo Code 等也在推动类似方案。
Fivetran CPO Anjan Kundavaram 认为,AI 智能体会大幅增加查询量,如果数据基础设施封闭,所有查询都走昂贵路径,成本将暴涨。他主张企业应拥抱开放数据基础设施和语义规范,而不是限制访问。
Notion 推出开发者平台,通过 Workers 运行自定义代码、同步外部数据库数据,并支持与 Claude Code、Cursor 等外部 AI 智能体协作,使其从笔记应用向可编程的智能体协作中枢转型。
Red Hat 发布智能体技能仓库,通过技能包(Skill Packs)让 AI 代理获得 20 多年的支持知识库和运维经验。RHEL 作为基础层,OpenShift AI 作为控制平面,Ansible 作为执行引擎,并内置安全治理机制。Red Hat 认为 AI 的下一个转折点不是更大的模型,而是能安全操作生产系统的代理。
Anthropic 的代理视图将多会话管理集中化,但开发者认为这并未解决智能体的信任与可靠性问题。长期运行的低风险任务可放手让代理执行,但高风险的业务仍需人工介入。此外,速率限制和 token 成本仍是隐忧。
本文分析了在云原生分布式系统中,编码 Agent 的反馈循环为何难以建立。传统的模拟、CI 后反馈、完整预览环境等方法都存在问题。文章提出了 Agent Harness 需要满足的四个环境属性,并指出运行时反馈是让 Agent 真正自主完成工作的关键。
本文介绍了Port团队如何构建技能库,通过版本控制、分组管理、自动同步和反馈循环,实现团队AI Agent技能的统一管理和持续改进,解决agent sprawl问题。
OpenShell 是 Nvidia 推出的开源安全运行时,旨在为自主 AI Agent 提供沙箱隔离与下层策略强制。它已获得 ServiceNow 的 Project Arc 采用,并与 LangChain 展开合作,成为企业级 Agent 部署的安全底座。