资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
Greg Brockman 公开表示模型本身不再是产品,这是从“大模型团队”立场的重大反转。AI21 关闭模型团队、DeepSeek 首次组建 Harness 团队,行业正在从纯模型竞争转向模型+框架+工作流+UI+记忆+经济的全栈竞争。但这也可能意味着,通过联合训练模型与闭源框架来进一步收紧模型访问权限。
GitHub 连续三年被 Gartner 评为企业 AI 编码代理领域领导者,在执行能力上排名最高。其 Copilot 已服务 14 万组织,年增长超 100%。GitHub 强调从代码生成到审查、安全、治理的全链路智能体能力,并持续投入多模型选择、智能路由和性能优化。
JetBrains 业务发展副总裁在 Google Cloud Next 上阐述独立价值:公司因从未融资而能保持模型中立,产品 Junie 默认 Gemini Flash 但也支持 Anthropic 和 OpenAI。新推出的 JetBrains Central 作为 AI 编码代理的治理和执行层,解决按 seat 定价与代理工作负载不匹配的问题。
测试发现 Claude 能快速发现明显和中等级别的财务问题,但漏掉了几个需要法务会计思维才能察觉的微妙线索。尽管如此,20 分钟完成原本数天的工作量,仍大大提升了效率,但人类监督依然不可或缺。
Daytona 为 AI 代理提供可组合的计算机资源,包括快速启动的沙箱(60ms)、动态资源扩展和裸机支持。其采用自研调度器,避开 Kubernetes 的痛点,并计划打造类似 Stripe 的 AI 云服务。
Datasette Agent 是一个可扩展的 AI 助手,提供对话式数据查询接口。支持通过插件生成图表、图片和代码执行。可运行本地模型,并已为 Datasette Cloud 用户准备。
datasette-agent-sprites 0.1a0 是 Simon Willison 发布的一个 beats,为 Datasette Agent 增加了与 Fly Sprites 交互的工具。
Docusign 在 Momentum 2026 上推出 MCP Server、Agreement Manager API、IAM Toolkit 和 Developer Console,让开发者能够构建智能体驱动的协议管理体验。MCP Server 让 Claude、Gemini 等 AI 工具直接操作 Docusign,Agreement Manager API 将分散的协议集中为可搜索数据源,IAM Toolkit 通过配置即代码将实施速度提升 40%,Developer Console 则统一了开发与生产环境管理。
Google 在 I/O 大会上推出信息智能体、Gemini Spark 等 AI 智能体产品,但命名混乱、功能演示浮于表面,且多数功能仅面向每月 100 美元的 Ultra 订阅用户。文章认为 Google 未能向普通消费者清晰展示 AI 智能体的实际价值,反而加深了技术鸿沟。
OpenAI 的通用推理模型以不到 1000 美元的成本推翻了 Erdos 平面单位距离猜想,证明了大语言模型在数学研究上的潜力。同时,Cohere 发布了 Apache 2.0 开源模型 Command A+,vLLM 首日支持。此外,多个新基准评测了智能体、记忆和科学工作流的表现,结果对当前前沿智能体并不乐观。
英伟达CEO黄仁勋在财报会上称,新CPU产品Vera专为AI智能体设计,开辟了2000亿美元新市场。尽管面临亚马逊等对手竞争,他表示Vera已售出200亿美元,并预测未来将有数十亿AI智能体使用专用CPU。
Jake Cooper 深入探讨了 Railway 从自建数据中心(3 个月回本)到 Temporal 工作流引擎、Railpack 构建系统、Central Station 内部工具等技术栈选择,并直言“Pull Request 正在死亡”,未来的软件开发生命周期将围绕智能体需求重构。
Anthropic 以每月 12.5 亿美元的价格租用 xAI 位于孟菲斯的 Colossus 1 数据中心全部算力,合同期限至 2029 年 5 月,总金额超 400 亿美元。该交易通过 SpaceX 的 SEC 文件披露,允许任意一方提前 90 天终止合同。xAI 借此形成“既自用又出租”的混合模式,以消化因 Grok 使用量下降而闲置的算力。
OpenAI 宣称其新推理模型自动推导出数学证明,推翻了一个 80 年未解的几何猜想,并获得了多位数学家的支持。如果验证为真,这将是 AI 首次独立解决一个领域内的重大开放问题。
Google I/O 2026 大会发布 Gemini 3.5 Flash(即日可用)、Gemini Omni(视频生成模型)、通用购物车(Universal Cart)等。AI 搜索升级为 AI Mode,支持多模态输入和智能代理。Gemini 应用新增 Omni 视频编辑功能。
作者因“不写自己无法体验的东西”的政策,只关注了已发布的 Gemini 3.5 Flash 和 Gemini Spark。Spark 是一个个人 Agent,连接 Google 应用,运行在 Antigravity 上(包括 CLI、SDK 和 IDE)。企业版强调安全隔离,但作者担心 prompt injection 风险。同时,开源的 Gemini CLI 将于 6 月停用,被闭源的 Antigravity CLI 取代。
NanoClaw 创始人拒绝2000万美元收购,完成1200万美元种子轮融资。项目在6周内从零到获得投资意向,并获得 Andrej Karpathy 和新加坡外交部长的公开赞誉。
Figma 推出 AI Agent,支持自然语言生成和编辑设计,可同时运行多个 Agent 完成不同任务。该功能首先在 Figma Design 中可用,未来将扩展到其他产品。