Kensho 用 LangGraph 构建多智能体金融数据检索框架

深度LangChain2026年3月26日4 分钟阅读
Kensho 用 LangGraph 构建多智能体金融数据检索框架
Kensho 作为标普全球的 AI 创新引擎,开发了 Grounding 框架,通过 LangGraph 构建统一的多智能体数据访问层,解决了企业级金融数据检索的碎片化问题。该框架将自然语言查询路由至专业的数据检索智能体,确保每个洞察都源自已验证数据集。

在 AI 智能体时代,高效搜索标普全球庞大的数据资产面临独特挑战。作为标普全球的 AI 创新和转型引擎,Kensho 的目标是确保 AI 在变革行业时,其输出始终基于可信数据——无论客户选择如何使用它。

Kensho 的工程师、研究员和构建者团队专注于将先进 AI 和机器学习应用于标普全球的丰富数据集,统一数据检索流程,为客户提供单一接口,将这些智能引入 AI 应用和智能体工作流。

与许多基于网络的搜索应用中的文本信息不同,标普全球数据高度结构化且细节丰富。这需要采用先进的数据检索技术,以有效将数据与前沿生成式 AI 应用集成。为解决这一挑战,我们开发了 Grounding,一个多智能体框架,作为标普全球数据的核心访问层。

Grounding 确保每个洞察都直接源自已验证数据集。该框架使用多种 LangGraph 工具开发,是一个基础解决方案,用于统一来自多个业务单元的数据,并将这些数据与 AI 智能体、LLM 和 GenAI 应用集成,同时保持高信任有效性和合规性。

挑战:碎片化的金融数据检索

金融专业人士经常在碎片化系统中进行数据检索时遇到困难,花费数小时定位和验证他们分析收益、检索金融指标、进行市场研究等所需的信息。Kensho 的 Grounding 系统通过创建单一入口点,用于针对标普全球已验证金融数据集的自然语言查询,简化了这一过程。这消除了导航复杂数据库模式或学习专门查询语言的需要。通过 Grounding,客户可以访问准确的实时金融信息,并获得引用标普全球数据源的响应,确保每个结果都具有高信任有效性、透明度和可追溯性。这种模式使用户能够专注于分析,而非数据访问搜索和来源验证。

用 LangGraph 设计多智能体框架

我们将 Grounding 系统架构为跨 AI 智能体的数据访问集中入口点,这些智能体从标普全球跨部门的各种数据仓库中检索数据。与其将自然语言解析逻辑嵌入单个智能体,我们的路由器智能地将查询定向至专业的数据检索智能体(DRAs),这些智能体由不同数据团队拥有,如股票研究、固定收益、宏观经济学等领域。这提供了数据路由和数据检索层之间的关注点分离,支持每个层的并行所有权。

Grounding 搜索智能体包括一个调用标普全球 DRAs 的路由器组件。

DRAs 旨在提供单一责任垂直,提高使用该数据集的查询的信噪比。路由器内的聚合层然后解决映射-归约问题:获取来自多个 DRAs 的分布式响应,并智能地将它们组合成连贯、可操作的洞察,保持准确性和上下文。

LangGraph 是 Grounding 路由器背后的引擎。其核心职责包括基于用户查询的相关上下文提供对多样化智能体的访问,将查询分解为更小的 DRA 特定子查询,并将响应聚合回用户。LangGraph 的设计使得在本地迭代和测试路由器变得容易,提供单一入口点并确保流畅的开发者体验。

建立自定义数据检索协议

分布式数据和 AI 系统经常遭受不一致通信接口的困扰。这可能导致不可靠的智能体交互,并为每个智能体创建复杂的数据处理需求。通过我们团队的早期内部实验,我们开发了一个自定义 DRA 协议,以确保一致的数据访问模式。

该协议为所有返回数据建立了通用数据格式,包括结构化和非结构化数据。这加速了我们整个多智能体生态系统中的协作和一致数据交换,因为我们在标普全球范围内开发和部署连接到 Grounding 的 DRAs。

以这种方式架构协议,通过我们的 Grounding 系统集中化,使 Kensho 能够快速部署多个专业金融 AI 产品(即智能体和 API),每个产品都利用相同稳健的数据基础。从我们的股票研究助手——帮助分析师比较行业表现——到我们的 ESG(环境、社会和治理)合规智能体,跟踪可持续性指标,所有应用共享相同的可靠数据访问层。在一致系统之上构建智能体和产品加速了我们的上市时间,使新创建的智能体能够立即访问标普全球数据的全部广度,而无需重建数据管道。

演化智能体生态系统的关键经验

构建和优化我们的多智能体框架的过程让 Kensho 团队获得了一些关键洞察。我们希望这些最佳实践能帮助指导其他组织开发复杂多智能体架构:

1. 可观测性(Observability): 全面的追踪和深思熟虑的元数据要求对于保持智能体行为的可见性以及实现大规模有效调试和优化至关重要。我们的自定义协议允许我们在分布式多智能体系统中打包必要信息。原生嵌入的 LangGraph 集成是维护我们分布式系统并确保开发者端到端可追溯性和调试的关键组件。

2. 多阶段评估: 金融行业需要金融数据检索的高信任和确定性。评估我们的联邦智能体系统需要多方面的矩阵,评估路由决策、数据质量和答案完整性在多智能体检索的每个步骤。评估套件通过基于 LangGraph 的 RouterGraph 执行测试查询。我们测量针对选定智能体和各种数据智能体的准确性,专注于精确匹配(选择了正确的智能体并检索到预期响应)和工具调用(路由器是否选择了正确的工具,但获得了各种响应)。这使我们能够评估准确性并识别系统中的差距。

3. 协议研究和优化: 我们持续分析用户和智能体交互模式,这使得能够迭代优化 Kensho 的自定义协议。这显著提高了系统效率,最大化输出格式,既用于直接 LLM 上下文理解,也用于程序化处理——同时保持金融服务所需的可靠性。

加入我们的通讯

来自 LangChain 团队和社区的更新

输入您的邮箱

处理您的申请...

成功!请检查您的收件箱并点击链接确认订阅。

抱歉,出了点问题。请再试一次。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Simon Willison 正在重构 LLM Python 库的抽象层,以支持服务器端工具执行等新功能。他利用 Claude Code 分析了四大 LLM 提供商的客户端库,生成了用于测试的 curl 命令和 JSON 输出。这些调研材料已开源,旨在帮助设计更通用的 API 抽象。

深度Simon Willison·4月5日·1 分钟

智能体技能——包含程序性知识和可执行资源的结构化包,供智能体在推理时动态加载——已成为增强 LLM 智能体的可靠机制。然而,推理时技能增强存在根本性限制:检索噪声引入无关指导,注入的技能内容带来大量 token 开销,而模型从未真正习得它所遵循的知识。我们提出一个问题:技能是否可以被内化到模型参数中,使其在无需任何运行时技能检索的情况下实现零样本自主行为?我们提出 Skill0,一个专为技能内化设计的上下文强化学习框架。Skill0 引入了一种训练时课程,从提供完整技能上下文开始,逐步撤除。技能按类别离线分组,并与交互历史一起渲染为紧凑的视觉上下文,教授模型工具调用和多轮任务完成。动态课程机制…

深度·4月5日·17 分钟

评论