资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 924 篇文章
Hugging Face 发布了专为 AI Agent 优化的 hf CLI 工具。通过自动检测 Agent 环境、提供结构化输出、非阻塞设计等特性,Agent 在复杂任务上的 Token 消耗相比直接调用 API 降低 1.3-6 倍,且成功率更高。
AI从对话机器人转向自主智能体,CPU的作用反而更加突出:负责编排、API调用和内存管理等关键任务,并运行小模型。Google和Arm正在优化CPU+智能体的效率,如GKE Agent Sandbox和Axion处理器。
Meta 将其 AI 客服代理 Meta Business Agent 全球上线 WhatsApp,支持回答问题、推荐产品等。企业需付费使用,大型企业按 token 计费。
Coralogix 完成 2 亿美元 F 轮融资,估值 16 亿美元,距上一轮仅 11 个月。公司收入同比增长超 60%,超过半数的企业客户已开始使用 AI Agent 或命令行界面与其平台交互。这轮融资将用于加速 AI 产品、安全产品和全球扩张。
Uber 限制员工每月每款 AI 编码工具(如 Cursor、Claude Code)的 token 消费上限为 1500 美元。以每位工程师使用两款工具计算,年上限约 3.6 万美元,占其薪资包中位数的 11%。
Reachy Mini 现在支持通过 MCP 协议调用 Hugging Face Spaces 上的远程工具,实现了工具与应用的解耦。本文介绍了内置工具、配置文件控制、远程工具的安装与管理、命名规则及提示词优化等关键技术细节。
微软与高通合作推出 Project Solara,一个芯片到云的智能体平台。纳德拉认为计算正在从操作系统和 App 转向智能体优先的未来。
Simon Willison 发布了 datasette-agent-micropython 0.1a0,这是一个将 MicroPython 运行在 WASM 沙箱中的工具,作为 Datasette Agent 的一个工具,允许安全执行 Python 代码。
Uber 因 AI 开支过高,对员工使用 Claude Code、Cursor 等编码工具设定了每月 1500 美元的上限。此前公司鼓励员工“尽量用 AI”,结果四个月就花光了全年预算。Uber 的 COO 也对 AI 的生产力影响表示怀疑,指出很难将 AI 使用与新功能直接关联。这事折射出整个行业对 AI 投资回报的普遍焦虑。
Anthropic 宣布扩大 Project Glasswing,新增约 150 个合作伙伴,覆盖电力、医疗等关键行业。这些组织将使用 Claude Mythos Preview 模型扫描代码库,已发现超过 10,000 个高危漏洞。同时,专家呼吁更透明的第三方验证机制。
微软发布开源标准 ACS,允许开发者以策略文件形式定义智能体的行为规则,并在工作流多个节点进行检查,支持拦截、放行、脱敏或人工审批。ACS 已以 SDK 形式提供,并集成 LangChain、OpenAI Agents SDK 等多种框架。
GitHub Copilot 桌面应用将多个智能体会话整合到单一视图中,支持独立的 git worktree 隔离运行。新推出的 Canvas 界面提供人与智能体的双向协作空间,结合云端与本地沙箱、可定制的代码审查以及 Copilot SDK,让开发者构建自己的智能体工具。
GitHub COO Kyle Daigle 在访谈中深入探讨了 AI 代理对代码托管平台的冲击:代理代码量 2026 年增长 1400%,GitHub 周提交量从 2025 年的 10 亿次/年飙升至 2026 年的 2.75 亿次/周,平台可用性下滑至 89.91%。他阐述了 GitHub 如何通过微技能、WorkIQ 和 MCP 整合 AI 工作流,并展望了 Copilot 从代码补全到全栈代理的进化。
GitHub Copilot 已切换为基于 Token 的按用量计费,取代了原来的高级请求模式。个人计划包含 AI Credits 配额,新增 Max 计划($100/月,含 $200 额度)。企业版引入四级预算控制,Credits 在组织层面共享。代码审查现在同时消耗 Actions 分钟和 AI Credits。
Anthropic 将 Project Glasswing 扩展至15国150家新组织,提供 Claude Mythos 以扫描关键基础设施代码漏洞;合作伙伴包括 Okta、三星、SK 海力士、NATO 等;Anthropic 同时已秘密提交 IPO 申请,估值近1万亿美元。
Holo3.1是H公司推出的电脑操控AI模型系列,在环境(网页、桌面、移动)、Agent框架和部署目标三个维度上提升了鲁棒性。首次发布量化版本,支持本地推理,性能损失极小,吞吐量大幅提升。
LLM 的输出不可信,但可以通过约束 token 采样空间来强制其生成合法输出。文中以日期解析为例,展示了如何用结构化输出实现比传统规则更智能的交互。同时提醒,给 LLM 的工具权限不能超过用户本身能访问的范围。
英伟达发布用于运行 AI 智能体的 PC 芯片 RTX Spark,ASUS、Dell、HP 等厂商今秋将推出相应 PC。该芯片基于 ARM 架构,性能达到 1 petaflop,支持本地运行大模型。黄仁勋表示这打开了 2000 亿美元的新市场,但也面临定价和市场竞争的考验。