资讯
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
找到 405 篇文章
Visitran 是一个现代化的、AI 原生的 Pythonic 数据转换平台,提供可视化 IDE 和 AI 助手。它支持多种数据库,具备完整的 Python 转换模型、DAG 执行引擎和任务调度功能,适合数据工程师和分析师使用。
Squad 是一个开源项目,让多智能体开发变得简单可访问。它采用仓库原生编排,通过版本化决策文件实现共享记忆,并利用独立上下文窗口避免上下文腐化。
OpenAI 开发了基于 GPT-5.4 的异步监控系统,用于检测内部编程智能体的未对齐行为。系统在五个月内监测了数千万次交互,识别出约 1000 次中等风险行为,但未发现最高风险案例。监控作为深度防御的一环,未来将向同步阻断演进。
Chainguard 推出 Chainguard Repository,通过统一端点和安全策略解决 AI 智能体引入的依赖泛滥问题。该产品已支持 JavaScript,提供超 7 万个 npm 包,并计划扩展至 Python、Java 等生态。同时,攻击者也在利用 AI 自动化寻找配置漏洞,安全态势需从消费点强制执行。
文章分析了AI向自主、长周期运行的智能体演进的技术趋势,并指出企业面临的安全与信任鸿沟。重点介绍了CrewAI作为智能体编排框架的双层架构(Flows和Crews)及其状态管理能力,以及NVIDIA NemoClaw如何通过沙箱、策略引擎和隐私路由器在基础设施层面提供安全执行环境。两者结合为构建企业级关键任务智能体系统提供了完整方案。
GPT-5.4 mini 在 SWE-bench Pro 基准测试中仅落后旗舰版 3 个百分点,运行速度却快两倍以上,API 成本也更低。nano 是 OpenAI 目前最便宜的模型,适用于高吞吐量工作。两者都旨在作为子智能体(Subagent)在智能体工作流中处理特定任务,而非单独使用。
WebMCP 通过 Chrome 扩展将网页转化为 MCP 服务器,让 AI 智能体直接与网页交互。文章介绍了其背景、人机协同场景,并提供了详细的 Chrome 预览版安装和测试步骤,包括启用实验性功能、安装调试工具和实际演示。
LangSmith Sandboxes 提供安全、可扩展的隔离环境,解决智能体运行不可信代码的风险。支持自定义 Docker 镜像、持久会话和微虚拟机隔离,集成 LangSmith 平台和 Deep Agents 框架。
Open SWE 是一个开源框架,旨在帮助企业构建内部编程智能体。它总结了 Stripe、Ramp 和 Coinbase 等公司的生产部署经验,提供了隔离沙箱、精选工具集、子智能体编排等核心组件。框架基于 Deep Agents 构建,支持通过 Slack、Linear 和 GitHub 集成到现有工作流中。
Featherless 推出托管版 OpenClaw,为开源 AI 智能体提供安全的沙箱运行时环境,并将 AI 模型成本打包进月费。报告显示,智能体工作流每次交互消耗的 Token 是标准聊天的 20-30 倍,托管服务旨在消除这种不可预测的财务风险。
Holotron-12B 采用混合 SSM 架构,显著提升了推理吞吐量和内存效率,在单 H100 GPU 上实现高达 8.9k tokens/s 的吞吐。模型在 WebVoyager 等智能体基准测试中表现优异,性能从 35.1% 提升至 80.5%。
子智能体通过分配新上下文窗口来执行特定任务,避免消耗主智能体的宝贵上下文容量。Claude Code 使用 Explore 子智能体探索代码库,并行子智能体可加速文件编辑,专家子智能体则专注于代码审查、测试或调试。
Codex 子智能体正式发布,支持默认子智能体和自定义智能体,可通过 TOML 文件配置。该模式已在多个编码智能体平台中广泛支持。
LangChain宣布与NVIDIA合作推出企业级智能体AI平台,整合双方技术栈。平台提供构建、加速、部署、监控、评估全流程工具,支持生产级AI智能体规模化部署。LangChain同时加入NVIDIA Nemotron联盟,共同推进前沿开放模型发展。
这篇讲义来自 NICAR 2026 研讨会,展示了如何用 Claude Code 和 OpenAI Codex 进行数据探索、清洗和可视化。工作坊使用 GitHub Codespaces 和 Python/SQLite,重点演示了让 Claude Code 直接编写交互式可视化代码的流程。
Cursor 安全团队基于 Cursor Automations 平台构建了四款安全智能体,用于代码审查、漏洞扫描、依赖更新和合规监控。这些智能体已处理数千次 PR,并开源了模板供其他团队自定义使用。
本文拆解了代码智能体的核心组件:LLM、聊天模板提示、工具调用机制和系统提示。还介绍了推理(Reasoning)等新特性,并建议通过自建简单智能体来加深理解。
文章区分了写代码与软件工程:前者是模式识别,智能体擅长;后者涉及权衡、约束和业务背景,需要开发者。作者提出三层任务分配模型,帮助团队划分智能体与开发者的工作边界,避免分配不当导致的效率损失。