资讯
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
Anthropic 扩展其托管 Agent 平台,新增“做梦”(research preview)、结果评估(outcomes)和多 Agent 编排三项功能。其中,“做梦”功能让 Agent 定期回顾工作并更新记忆,结果评估通过分级器提升任务成功率,多 Agent 编排支持主 Agent 拆解任务并分发给子 Agent。
Simon Willison 在 Heavybit 播客中讨论了 Vibe Coding 与智能体工程的界限模糊问题。他指出,随着 AI 代理可靠性提升,他不再审查每一行生产代码,这种信任带来了内疚感与风险。同时,他分享了软件评估方式的变化、瓶颈转移以及职业安全感的来源。
AlphaEvolve 是 Google DeepMind 推出的 Gemini 驱动的编程代理,过去一年在基因测序(错误率降低 30%)、电网优化(可行解从 14% 提升至 88%)、量子物理(错误率降低 10 倍)、AI 基础设施(TPU 设计、缓存策略)等领域取得突破,并开始服务金融(Klarna 训练速度翻倍)、物流(FM Logistic 路线效率提升 10.4%)等商业客户。
CopilotKit 获得 2700 万美元 A 轮融资,由 Glilot Capital、NFX 和 SignalFire 领投。其 AG-UI 协议标准化了 AI Agent 与用户界面的连接方式,支持流式聊天、前端工具调用和状态共享。公司还推出了 CopilotKit Enterprise Intelligence 自托管产品,旨在成为企业生态中的默认选择。
本文分析了 AI 代理自主交易面临的支付基础设施瓶颈。Stripe 的机器支付协议(MPP)解决了单次程序化交易问题,iWallet 的自主结算协议(ASP)则面向多参与方结算和物理世界验证。两者结合揭示了未来支付堆栈的演进方向。
MetaSKILL是AI Agent的小型工作流程序,通过SKILL.star文件定义循环、重试等动态逻辑,与静态的SKILL.md配合使用。规范定义了包格式、发现机制、执行环境、宿主API及预算限制,让Agent的重复性任务变得可靠且可审计。
企业 AI Agent 遥测缺乏标准化,Arize AI 与 Google Cloud 推动基于 OpenTelemetry 和 OpenInference 的统一模型。标准化后,开发者可以切换框架、模型、工具而不必重建埋点,同时保持可见性。行业专家指出,OpenTelemetry 并非万能,还需解决数据量、隐私和跨提供商碎片化问题。
GitHub CTO Vlad Fedorov 透露,公司原计划 2025 年 10 月将容量扩容 10 倍,但到 2026 年 2 月就发现必须设计 30 倍规模。这标志着智能体代码爆发已成为现实。文章认为,应对这一变化的关键是让智能体在编码阶段就能对自己的产出进行闭环验证,而不是把验证负担转嫁给下游管道。
fabrica 是一个用 Rust 构建的终端 AI 编程助手,支持多种 LLM 提供商,提供交互式 TUI、内置文件操作和 bash 工具,以及自主多步执行循环。安装简单,配置只需设置 API 密钥。
Incredibuild 发布 Islo 沙箱,为 AI 编码智能体提供持久、隔离的云环境。它通过外部 gateways 和 credential-blind 设计解决安全与治理问题,支持策略管控,并与 Harbor Framework 社区合作。价格从免费到企业级可选。
Mistral AI 发布 Mistral Medium 3.5 模型(128B 参数,256k 上下文窗口),并将代码助手 Vibe 迁移至云端,支持远程并行 Agent。同时 Le Chat 新增工作模式(Work Mode),可处理长时间任务。Mistral 保持开放权重策略,在欧洲市场差异化竞争。
Supersimple 是轻量级 OpenCode 配置文件,提供精简的智能体集、基于编排器的默认入口、本地技能和命令,以及 Conductor 工作流支持。适合日常开发中的规划、实现、调试、文档和任务追踪。
OpenAI发布Codex for Work,将其定位为面向所有人的计算机任务代理,并提升42%的计算机使用速度。Anthropic推出Claude Security代码审计工具,并新增对Blender、Adobe等创意软件的支持。GPT-5.5在英国AI安全研究所的多步骤网络攻击模拟中达到与Claude Mythos Preview相近的水平。
Link 是 Stripe 推出的数字钱包,支持多种支付方式和管理订阅,并内置 AI 智能体支付功能。用户通过 OAuth 授权智能体,审批每次交易,未来还将支持支出限额和无需审批的模式。开发者可直接集成 Link 钱包。
Cloudflare 和 Stripe 合作,允许编码 Agent 自动创建 Cloudflare 账户、购买域名、获取 API token,并部署应用到生产环境。新协议包含服务发现、身份验证和支付 token 化,使 Agent 能自主完成零到生产的全流程。目前 Stripe Projects 已开放公测。
本文介绍了 AWS 开源 Agent 框架 Strands Agents 的实践案例。通过将 API 端点工具替换为基于意图的工具,并将工具部署到远程 MCP 服务器并启用语义搜索,开发者成功将一次查询的 token 消耗从 52K 降至 2K,效果显著。核心原则是限制 Agent 可用的工具数量,使其更专注于特定任务。
Anaconda 收购 Outerbounds,将 Metaflow 的生产级编排与 Python 依赖栈整合,为企业提供从安全环境到生产级编排的统一平台。AI 生成代码缺陷率高、依赖风险大,治理成为瓶颈,此次收购直指这一痛点。
Anthropic 的 Managed Agents 平台提供沙箱、持久记忆、检查点等基础设施 API,意图成为 AI Agent 时代的 AWS。实测上手快但很快需要编码,更适合企业级部署而非个人开发者。