资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
OpenAI 宣布 Codex 已集成到 ChatGPT 手机应用,用户可通过移动设备远程管理开发工作流,包括查看实时环境、审核输出、批准命令等。该功能目前处于预览阶段,支持 iOS 和 Android,所有用户均可使用。
OpenAI 宣布 Codex 从桌面端扩展到 ChatGPT 移动端,实现桌面环境同步和远程 SSH 接入,同时增加程序化访问令牌和 HIPAA 合规支持。移动端将集成到 ChatGPT 应用而非独立 App。
Clawdmeter 是一个开源桌面硬件,通过蓝牙读取 Claude Code 的 OAuth token 获取使用数据,以像素动画和简易图表展示会话及周用量。项目上线后迅速获得 800+ GitHub 星标,50 多人 fork。
Granite Embedding Multilingual R2 系列采用 ModernBERT 架构,支持 32K 上下文和 200+ 语言,其中 97M 模型以 60.3 分成为多语言检索最优的小参数模型,311M 模型得分 65.2,均较前代大幅提升。模型兼容主流框架,提供 ONNX/OpenVINO 部署选项。
Conductor 推出 Conductor Cloud,将 AI 编码代理从本地 Mac 应用迁移到托管云环境中运行。该公司认为,随着代理数量增加,管理多个代理成为界面挑战,云化是必然方向。Anthropic、Mistral 和 Roo Code 等也在推动类似方案。
Codex 现已集成到 ChatGPT 手机应用,支持 iOS 和 Android,可远程连接运行 Codex 的电脑,实时同步终端输出、截图、差异对比等。结合 Remote SSH 通用可用、Hooks 和程序化访问令牌等新功能,团队能更高效地管理长时间运行的任务,并满足企业级安全需求。
Anthropic 改变定价,Claude 订阅用户每月可获得等值美元金额的 API 额度,原本被视为好 deal,但因历史补贴(约 70-90% 折扣)被部分用户视为“rug pull”。与此同时,OpenAI 推出企业切换促销,两大 AI 实验室的定价战进入新阶段。
Fivetran CPO Anjan Kundavaram 认为,AI 智能体会大幅增加查询量,如果数据基础设施封闭,所有查询都走昂贵路径,成本将暴涨。他主张企业应拥抱开放数据基础设施和语义规范,而不是限制访问。
Notion 推出开发者平台,通过 Workers 运行自定义代码、同步外部数据库数据,并支持与 Claude Code、Cursor 等外部 AI 智能体协作,使其从笔记应用向可编程的智能体协作中枢转型。
MinIO 发布 MemKV,通过基于 NVMe 和 RDMA 的持久化上下文内存存储,消除 AI 推理中的重计算税。该产品可提升 GPU 利用率 95%+,降低 Token 成本 50%,并允许开发者以无状态方式部署推理层。
Anthropic产品负责人Cat Wu在Code with Claude大会上表示,AI的下一个重大突破是主动性,未来Claude将理解用户工作内容并主动设置自动化。她强调产品策略应聚焦于前沿而非竞争对手,并认为管理AI智能体与管理人类团队类似,管理者仍需是领域专家。
Red Hat 发布智能体技能仓库,通过技能包(Skill Packs)让 AI 代理获得 20 多年的支持知识库和运维经验。RHEL 作为基础层,OpenShift AI 作为控制平面,Ansible 作为执行引擎,并内置安全治理机制。Red Hat 认为 AI 的下一个转折点不是更大的模型,而是能安全操作生产系统的代理。
Anthropic 的代理视图将多会话管理集中化,但开发者认为这并未解决智能体的信任与可靠性问题。长期运行的低风险任务可放手让代理执行,但高风险的业务仍需人工介入。此外,速率限制和 token 成本仍是隐忧。
OpenAI Daybreak 和 Anthropic Glasswing 均提供基于前沿模型的漏洞检测,基准测试成绩接近。二者最大的区别在于访问模式:Daybreak 采用分层信任框架,面向更广泛的验证防御者;Glasswing 则是一个封闭联盟。三家主要安全厂商同时加入两个平台,反映出安全工具需要模型无关的平台层。
作者对比测试了GPT-5.5 Instant与GPT-5.2,发现:5.5在准确性上确实更可靠,出现幻觉的概率更低;但在简洁性上不如5.2,回答更冗长;个性化方面有细微提升,但普通用户不易察觉。
Agent 正在打破软件通过 UI 和肌肉记忆建立的粘性。系统记录的防御性将转移到数据模型、工作流逻辑、合规以及网络效应和专有数据等新层面。不同系统(CRM、ATS、ERP)的切换成本差异巨大,关键在于访问频率、读写模式、隐性流程、依赖关系和合规要求。
Ramp基于5万多家企业客户支出数据的AI指数显示,Anthropic的企业付费客户占比达34.4%,首次超过OpenAI的32.3%。过去一年Anthropic份额猛增,OpenAI微降,但分析师认为优势未必持久。
本文介绍了Port团队如何构建技能库,通过版本控制、分组管理、自动同步和反馈循环,实现团队AI Agent技能的统一管理和持续改进,解决agent sprawl问题。