资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 583 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 583 篇文章
CrewAI AMP 定位为智能体操作系统,提供快速构建、安全控制和跨组织扩展能力。平台支持代码或无代码构建,集成内存、安全护栏(Guardrails)和流程管理,已在金融、消费品和科技行业验证规模化应用。
文章展示了如何利用推测解码和深度剪枝技术,加速 Qwen3-8B 模型在 Intel® Core™ Ultra 平台上的推理性能。优化后的模型已集成到 🤗smolagents 库中,可用于构建高效的本地 AI 智能体。
本文介绍了 Smol2Operator 项目,通过两阶段训练将 SmolVLM2-2.2B-Instruct 模型从零基础培养成具备 GUI 感知和认知能力的智能体。第一阶段统一了异构数据集的动作空间,第二阶段则增强模型的推理能力。
SyGra 是一个用于构建和转换大语言模型(LLM)与小语言模型(SLM)训练数据的低代码框架。它通过统一的执行框架(Harness)简化了复杂数据集的生成流程,支持 vLLM、Hugging Face TGI 等多种推理后端。开发者可以用它加速模型对齐、节省工程时间,并专注于提示工程(Prompt Engineering)。
Gaia2 是 GAIA 基准的升级版,专注于交互行为和复杂性管理,在模拟智能手机环境中评估智能体。配套的 ARE 框架提供结构化追踪和调试功能,支持自定义扩展。团队已用多个主流模型完成评测,结果显示时间敏感任务仍是当前最大挑战。
本文详细介绍了 transformers 库为支持 GPT-OSS 模型所做的升级,包括零构建内核、MXFP4 量化、张量并行等新特性。这些优化不仅适用于 GPT-OSS,也能惠及 transformers 中的其他模型。
Together AI 宣布其平台现已支持微调 Hugging Face Hub 上的任何兼容 LLM,大幅降低了模型定制化的门槛。开发者只需指定一个基础模型作为配置模板,即可微调自己选中的 Hugging Face 模型,并可将结果模型自动推送回 Hub。该功能已帮助 Slingshot AI、Parsed 等团队加速了模型开发流程。
本文介绍了 Hugging Face 开发的 Jupyter Agent,这是一个能让 LLM 在 Jupyter Notebook 环境中执行代码的智能体。团队通过简化执行框架(Harness)和构建高质量训练数据管道,成功将 Qwen3-4B 模型在 DABStep 基准测试简单任务上的准确率从 44.4% 提升到 59.7%。
EmbeddingGemma 基于 Gemma3 架构改造为双向编码器,拥有 2K 上下文窗口和 768 维输出,支持按需截断至 512/256/128 维以节省资源。文章详细展示了其在 Sentence Transformers、LangChain 等框架中的使用方法,并通过医疗数据集微调案例证明其领域适应能力可超越更大模型。
CrewAI 入选 2025 年 IA40 榜单,与 OpenAI、Anthropic 等巨头并列第 7 位,是榜单中唯一的智能体管理平台(AMP)。公司凭借约 2000 万美元融资实现这一里程碑,强调其产品在易用性、可靠性和可扩展性上的优势。创始人表示这只是开始,将继续推动智能体劳动力(Agentic Workforce)的行业定义。
DeepSeek-V3.1 在 Together AI 上提供混合推理能力,支持快速响应和深度推理两种模式,性能接近 DeepSeek-R1 但速度更快。模型内置代码和搜索智能体支持,适用于生产环境部署,提供 99.9% 的 SLA 保障。
文章探讨了如何构建 AI 智能体来自动化复杂的工程工作流,如 LLM 推理优化。作者基于内部实践,总结了基础设施和行为两方面的六种关键模式,包括工具设计、文档编写、安全执行、并行会话管理、等待时间管理和进度监控。
文章详细讲解了如何将 Claude 连接到 Hugging Face 的 MCP 服务器,从而扩展其图像生成能力。重点介绍了 FLUX.1 Krea 模型如何消除典型的“AI感”,生成专业摄影级别的自然图像;以及 Qwen-Image 模型在文字渲染和提示跟随方面的优势,适合制作海报、信息图等。
OpenAI 发布开源模型 gpt-oss-20B/120B,Together AI 平台简化微调流程,支持 LoRA 训练,部署后性能稳定、成本更低。
Parsed 展示了如何通过高质量数据、严谨评估框架和迭代优化,让 27B 参数的开源模型在医疗转录等专业任务上超越 Claude Sonnet 4 60%,同时成本大幅降低。他们的评估框架将复杂任务分解为二进制检查,驱动监督微调和强化学习,实现透明、可审计的模型改进。
NVIDIA 新推出的 Llama Nemotron Super 1.5 模型在 CrewAI 中部署简单、集成顺畅,特别适合结构化工作流。在 CrewAI Flows 低层编排中运行速度很快,工具调用能力扎实,是面向企业环境的可部署资产。
Together AI 对 OpenAI 新开源模型 gpt-oss-120B 与 o4-mini 进行了五项实际任务测试,涵盖代码生成、创意设计、指令遵循、数学推理和信息检索。gpt-oss-120B 在终端游戏开发和复杂指令改写中胜出,o4-mini 在 SVG 生成上更优,数学与信息任务打平。开源模型展现出与闭源模型竞争的实力,且具备完全所有权、低成本等优势。
OpenAI 新发布的开源模型 gpt-oss-120B 和 gpt-oss-20B 已在 Together AI 上线,支持无服务器和专用端点部署。Together AI 平台提供优化的推理性能、高可靠性及全套开发者工具,便于企业快速部署和应用。