资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 581 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 581 篇文章
Agent Memory 是 Cloudflare 推出的托管服务,为 AI 智能体提供持久化记忆,支持批量提取和直接工具调用。它适用于多种智能体架构,数据可导出,旨在降低切换成本。
Claude Opus 4.7 在 SWE-Bench Pro 等多项编码基准测试中提升显著,最高达 11 分。模型支持高达 2576 像素的长边图像输入,视觉能力大幅增强。尽管新分词器可能导致 token 使用量增加 35%,但推理效率的提升使整体 token 成本仍可能下降一半。
llm-anthropic 0.25 版本发布,主要更新包括支持 Claude Opus 4.7 模型及其 thinking_effort: xhigh 参数,新增 thinking_display 和 thinking_adaptive 布尔选项,并提高了默认 max_tokens 至各模型允许的最大值。
本文基于对 AWS 工程师 Clare Liguori 的采访,探讨了亚马逊在 MCP 项目中的角色,包括托管服务器、贡献新功能如 Tasks 和 Elicitations,以及作为实验平台测试草案概念。文章还展望了 MCP 在非技术公司的应用前景,如通过 Amazon Quick 等工具降低使用门槛。
OpenAI 全面升级 Codex,新增后台运行、多智能体并行、内置浏览器、记忆功能和图像生成等能力,并集成 111 个插件。公司还推出按需付费选项,强化企业市场竞争力,以应对 Anthropic 的挑战。
HoloTab 是 Hugging Face 推出的浏览器智能体,利用 Holo3 模型实现计算机使用(Computer Use),直接在网页界面上操作。这种无需集成的智能体方式,与 Anthropic、OpenAI 等公司的桌面级计算机使用功能形成互补,旨在自动化更多日常软件任务。
Claude Opus 4.7 在指令跟随、高分辨率图像理解、文件系统记忆和金融分析任务上表现优于前代,但安全性方面进展不大,且 token 使用量可能增加。Anthropic 确认 Mythos Preview 仍是其能力最强、对齐最好的模型,并计划在 Opus 4.7 上测试新的网络安全防护措施。
Qwen3.6-35B-A3B 量化模型在 MacBook Pro 上生成的鹈鹕骑自行车 SVG,在自行车框架形状等细节上优于 Anthropic 新发布的 Claude Opus 4.7。作者指出,这个玩笑测试虽与模型通用能力不完全相关,但反映了当前模型比较的荒诞性。
Codex 新增后台计算机使用功能,可在 Mac 上自动化任务而不中断用户操作。内置 Atlas 浏览器支持页面交互和前端反馈。图像生成和大量插件扩展了非编程用例,而心跳自动化(Heartbeats)支持持续任务执行。更新还包含开发者工具改进,如多终端标签和远程 SSH 连接。
InsightFinder 完成 1500 万美元 B 轮融资,专注于解决 AI 智能体在生产环境中的可靠性问题。其平台通过无监督机器学习、专有语言模型和因果推理等技术,提供端到端的 AI 可观测性。公司已服务 UBS、NBCUniversal、Google Cloud 等大型企业客户。
Roblox 推出增强版 Roblox Assistant,引入规划模式以协作制定可编辑的行动计划,并新增网格生成和程序化模型生成工具来加速 3D 内容创建。这些智能体功能通过多步骤协作和自动化测试,帮助开发者更高效地规划、构建和测试游戏。
Expo 获得 4500 万美元 B 轮融资,并聘请前 Meta React 负责人 Seth Webster 担任首席开发者布道师。公司同时推出了 Expo Agent 公测版,这是一个基于 Claude Code 构建的系统,旨在帮助开发者使用 React Native 将移动应用从想法变为生产就绪状态。Webster 认为,React 的声明式特性与 LLM 配合良好,而跨平台方法在 AI 开发成本可能上升的背景下将更具优势。
Cloudflare AI 平台通过 AI Gateway 提供统一推理层,支持 70+ 模型和 12+ 供应商,实现一键切换和集中成本管理。平台优化了智能体(Agent)的延迟和可靠性,包括快速首 token 响应、自动故障转移,并计划支持用户自带模型。
本文深入解析了 Cloudflare 为支持智能体应用而构建的高性能 AI 推理技术栈。重点介绍了预填充解码分离架构、KV 缓存优化、推测解码等核心优化手段,以及自研推理引擎 Infire 在多 GPU 支持、内存效率和冷启动速度上的突破。
Artifacts 是一个专为智能体设计的分布式版本化文件系统,兼容 Git 协议,支持大规模仓库创建和自动化管理。它基于 Durable Objects 和 Zig 编写的 WASM Git 服务器构建,适用于代码、配置、会话历史等多种数据的持久化存储。
这部分主要讲 AI Search 解决的是什么问题,以及它在支持型 Agent 里的具体用法。核心更新包括混合检索、实例自带存储和向量索引、跨实例搜索、按元数据提升排序,以及新的 `ai_search_namespaces` 绑定。
Antioch 致力于为物理 AI 开发者提供高保真仿真平台,以解决现实世界数据稀缺和测试成本高昂的问题。其产品被比作机器人领域的 Cursor,允许开发者在虚拟环境中测试硬件、生成训练数据。目前公司主要聚焦于传感器和感知系统,并与多家客户合作优化仿真模型。
Codex 现在能操作电脑、浏览网页、生成图像,并具备记忆功能,可自动规划长期任务。更新还包括多终端、SSH 连接和插件集成,提升开发效率。