资讯
AI Agent Skills 生态的最新动态、教程和深度分析
找到 170 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
找到 170 篇文章
LangSmith Agent Builder 更新引入了中央聊天智能体,可访问工作空间所有工具,支持将任意对话转化为可复用智能体,并新增文件上传功能。工具管理也得到简化,提供统一注册表进行查看和认证。
研究显示,Claude Code 的自主运行时长显著增长,经验用户更信任其自主工作。智能体已在软件工程、医疗、金融等领域应用,但高风险场景尚未规模化。有效监管需结合部署后监控与新型人机交互范式。
文章介绍了 LangChain 如何通过执行框架工程显著提升其编码智能体 deepagents-cli 的性能。核心方法包括利用追踪分析技能自动化诊断错误、通过系统提示和中间件强制智能体进入“构建-验证”循环、为智能体注入环境上下文、以及采用“推理三明治”策略优化计算资源分配。这些实践为构建更强大的智能体应用提供了具体指导。
Anthropic 与印孚瑟斯合作,旨在利用 Claude 和 Infosys Topaz 平台加速企业软件开发生命周期,并为电信、金融等高度监管行业构建定制化 AI 智能体。合作将聚焦于网络运营现代化、风险合规自动化、产品设计加速等具体场景。印度是 Claude.ai 第二大市场,此次合作也是 Anthropic 扩大印度市场布局的一部分。
文章探讨了智能体框架从 LangChain 到 LangGraph 再到 DeepAgents 的三代演变,强调框架的价值在于加速开发、编码最佳实践。同时,LangSmith 作为独立的可观测性平台,支持多种框架甚至无框架的智能体,是生产部署的关键。
OpenEnv 是一个用于评估 AI 智能体在真实系统而非模拟环境中表现的框架。Turing 基于此构建了 Calendar Gym,一个模拟真实日历管理复杂性的测试环境。评估发现,智能体在多步推理、处理模糊性以及正确调用工具参数方面存在显著瓶颈。
团队通过 Codex 智能体在零手写代码约束下,五个月交付了百万行代码的产品,工程效率提升十倍。核心经验包括:将知识库结构化而非堆砌指令、推动更多上下文入仓以提升智能体可读性、通过强制约束而非微观管理来保持代码库一致性。
本文分析了智能体与沙箱集成的两种架构模式:智能体在沙箱内运行(模式1)和沙箱作为工具被远程调用(模式2)。模式1更贴近本地开发,但通信复杂、密钥在沙箱内;模式2迭代快、密钥安全,但有网络延迟。deepagents 框架支持两种模式。
Xcode 26.3 将 Claude Agent SDK 原生集成到 IDE 中,让 Claude 能自主处理长期运行的复杂编码任务,如通过预览进行视觉验证、跨项目推理和基于目标的任务分解。该版本现已作为发布候选版向 Apple 开发者计划成员开放。
LangSmith Agent Builder 正式发布,支持用自然语言构建智能体。LangChain JS 更新提升了智能体鲁棒性。官方发布了关于智能体可观测性(Observability)与评估的深度指南,并推出了新版 Chat LangChain 和支持门户。全球多地将在二月举办以智能体为主题的社区活动。
文章指出,智能体系统开发应遵循“爬、走、跑”的迭代路径,避免陷入过度设计的POC陷阱。通过医疗背景核查案例,说明从单一任务起步、快速交付、人机协同的价值。最后给出具体启动建议:窄范围、短周期、显式失败、按需增智能体。
OpenAI 构建了一个内部专用的 AI 数据智能体,用于高效处理公司内部超过 600 PB 的数据。该智能体结合了多层次的上下文(元数据、代码定义、公司文档、记忆系统)来确保推理的准确性,并支持对话式交互和自学习,显著提升了跨部门的数据分析效率。
OpenAI 针对 AI 智能体点击链接时的 URL 数据窃取风险,设计了基于独立网络索引的验证机制。只有公开存在的链接才允许自动加载,否则会触发用户警告。这是多层安全策略中的一环,旨在防止用户数据通过 URL 泄露。
本文记录了 LinkedIn 团队使用 verl 框架对 GPT-OSS 模型进行智能体强化学习训练的过程。他们遇到了因 MoE 架构路由差异导致的 PPO 训练不稳定问题,并通过强制重要性采样比为 1 的修复方案解决了该问题。
DSGym 是一个集成的框架,用于在自包含的执行环境中评估和训练数据科学智能体。它整合了 90 多个生物信息学任务和 92 个 Kaggle 竞赛,并支持轨迹生成用于训练。使用该框架训练的 4B 模型在开源模型中表现优异。
文章基于CrewAI处理20亿次智能体工作流的经验,分析了企业从演示到生产系统的主要障碍。核心发现包括:信任需要在生产中建立、架构选择影响巨大、完整技术栈决定实施速度。
本文是 Codex 技术解析系列的第一篇,聚焦于智能体循环的工作原理。文章详细解释了 Codex CLI 如何通过 Responses API 编排模型、工具和提示,并管理上下文窗口以完成软件任务。
人机协同(HITL)让需要 99.9% 准确率或合规审批的用例得以部署。CrewAI 开源框架通过 @human_feedback 装饰器原生支持 HITL,企业版 AMP 则提供了邮件通知、智能路由、SLA 追踪等生产级控制平面功能。