资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 581 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 581 篇文章
OpenAI 更新 Agents SDK,引入原生沙箱执行和模型原生执行框架,提升智能体在文档、文件和系统任务中的能力。SDK 支持可配置内存、沙箱感知编排和便携式工作空间描述,旨在简化生产部署并增强安全性与可扩展性。
Notion 的自定义智能体功能经历了四到五次重大重构才最终发布,早期失败源于缺乏工具调用标准、上下文窗口过短和模型不可靠。团队现在专注于构建“软件工厂”(Software Factory)愿景,即由智能体协同完成代码的规划、编写、测试和调试。
文章探讨了传统监控工具在应对自主 AI 智能体时的不足,以及 AI 可观测性平台如何演变为审计平台。它强调了运维团队需要新的 AI 原生词汇和监控指标,并分析了使用 AI 审查 AI 可能带来的同质化陷阱风险。
Anthropic 重新设计了 Claude Code 桌面应用,新增集成终端、侧边聊天、性能更强的 Diff 查看器和可自由排列的面板。应用底层也进行了重构,提升了可靠性和速度,并支持流式输出(Streaming)。
Claude Code 新增的 Routines 功能允许开发者配置一次提示、仓库和连接器,然后按计划、通过 API 调用或事件触发自动运行。它运行在云端,无需本地电脑开机,但订阅计划有每日执行次数限制。
Embabel 是一个基于 Spring Boot 和 Kotlin 的 JVM 智能体框架,旨在通过强类型和 GOAP 规划算法解决企业 AI 应用的确定性问题。框架将 LLM 视为类型系统的参与者,而非黑盒,并支持多模型按步骤选择。
Claude Mythos Preview 在 ASI 的网络安全能力评估中表现突出,首次成功完成 32 步企业网络模拟攻击,平均完成 22 步。模型在专家级 CTF 任务中成功率 73%,远超现有模型。但评估也指出,其在真实世界攻击有防御系统时的能力尚不确定。
GitHub 安全代码游戏第四季推出,主题是 AI 智能体安全。玩家将扮演攻击者,在五个渐进关卡中利用自然语言提示,让一个名为 ProdBot 的故意存在漏洞的 AI 助手暴露其不应访问的秘密。游戏无需安装,在 GitHub Codespaces 中即可免费体验,旨在帮助开发者建立识别智能体安全风险的直觉。
Skills 功能允许用户在 Chrome 中保存和复用 AI 提示词,简化重复性任务。用户可创建自定义工作流,或从官方库中直接添加预设技能。功能基于 Chrome 的安全架构,需要用户确认敏感操作。
Chrome 新增 Skills 功能,允许用户保存和复用 AI 提示词,实现跨网页自动化操作。Google 还提供了预设技能库,涵盖生产力、购物、食谱等场景。该功能目前仅支持英文(美国)语言设置。
KumoRFM-2 是专为关系型数据设计的基础模型,支持用自然语言查询,无需训练即可在数百亿行数据上运行。它在基准测试中超越了监督机器学习方法,并能直接理解表间关系,替代传统数据科学流程。
Cloudflare Mesh 是一个私有网络服务,将多云环境整合为单一安全网络,支持人类、AI智能体和代码的安全连接。它解决了传统VPN访问慢、风险高的问题,为每个智能体提供身份验证,并通过Cloudflare全球网络路由流量,确保性能和安全。
作者认为框架和执行框架正快速商品化,构建成本降低使价值转向不可复制的层,如专有数据和信任。他提出纠缠软件概念,即产品与客户相互适应,并透露 CrewAI 正朝此方向演进,打造能学习客户工作流的平台。
Cloudflare 分享了其企业级 MCP 部署的最佳实践,包括使用远程 MCP 服务器提升可见性与控制、通过 Cloudflare Access 实现身份验证、利用 MCP 服务器门户集中治理。文章还介绍了新推出的 Code Mode 以降低 token 成本,以及如何用 Cloudflare Gateway 检测未授权的 Shadow MCP。
Cloudflare Access 新增托管 OAuth 功能,解决了 AI 智能体无法访问受保护内部应用的问题。该功能基于 RFC 9728 等标准,让智能体可以代表用户完成 OAuth 授权流程,获取访问令牌。这不仅提升了安全性,也避免了使用服务账户带来的审计和权限混淆问题。
Cloudflare Mesh 为 AI 智能体、开发者和服务提供安全的私有网络访问,无需手动隧道。它基于 Cloudflare One 平台,支持双向多对多连接,并集成了网关策略、设备状态检查等安全控制。
OpenAI 扩展了网络安全可信访问计划,引入专为网络安全微调的 GPT-5.4-Cyber 模型,并基于民主化访问、迭代部署和生态系统韧性三大原则,逐步提升防御能力与模型能力同步扩展。
微软计划推出类似 OpenClaw 的智能体,集成到 Microsoft 365 Copilot 中,主打企业级安全控制。该智能体可能本地运行,支持多步骤、长时间任务,预计在 Build 大会上亮相。