LangChain + MongoDB 联手:AI 智能体栈跑在你信任的数据库上

指南LangChain2026年3月31日5 分钟阅读
LangChain + MongoDB 联手:AI 智能体栈跑在你信任的数据库上
LangChain 与 MongoDB 合作,将向量搜索、持久化记忆、自然语言查询和端到端可观测性集成到 MongoDB Atlas 平台。企业团队现在可以在现有数据层上构建生产级 AI 智能体,无需额外架构。

构建生产级 AI 智能体,光有模型和提示词(Prompt)远远不够。智能体需要检索(Retrieval)、持久化记忆(Persistent Memory)、访问运营数据、可观测性(Observability),以及跨全流程的可靠部署。LangChain 与 MongoDB 合作,将这些功能全部集成到一个开放平台中,让团队无需重构数据层,就能从原型快速推进到生产环境。

我们合作的团队经常遇到一个共同模式:先搭建一个智能体原型,运行良好,但一到生产环境就问题频出——需要能应对崩溃的持久化状态、基于真实企业数据的检索、查询结构化数据库的能力,以及出错时的端到端追踪。通常的解决方案是东拼西凑:这里加个向量数据库(Vector Database),那里放个状态存储,再找个地方接上分析 API。每个组件都是独立的系统,需要单独配置、确保安全、保持同步。

MongoDB 是大量企业团队存储运营数据的地方。超过 65,000 家客户在 Atlas 上运行关键业务应用。我们共同思考了一个战略问题:如果智能体能直接运行在这个基础上,而不是要求团队搭建平行基础设施,会怎样?

这次合作正是为了实现这个目标。通过 LangSmithLangGraphLangChain 的深度集成,MongoDB Atlas 变成了一个完整的 AI 智能体后端:向量搜索、持久化智能体记忆、自然语言数据访问、全栈可观测性和有状态部署。所有这些都运行在一个开放、多云平台上。

集成带来哪些功能

在 MongoDB 生产数据上,用 LangSmith 构建可靠智能体

Atlas Vector Search 实现检索增强生成(RAG)。 Atlas Vector Search 已原生集成到 LangChain 中,作为即插即用的检索器(Retriever),支持 PythonJavaScript SDK。你可以从单个 MongoDB 部署运行语义搜索、混合搜索(Hybrid Search)(BM25 + 向量)、GraphRAG 和预过滤查询。如果你已经在运行 Atlas,无需额外搭建基础设施。向量数据与运营数据存储在一起,这意味着没有同步任务,没有系统间的最终一致性问题,只有一套访问控制。对于评估检索质量的团队,还有一个内置的 RAG 评估管道,可与 LangSmith 集成,长期追踪准确性。

LangSmith 的 MongoDB 检查点实现持久化智能体记忆和状态。 生产级智能体需要持久化状态。客户支持智能体在会话中丢失对话历史、事件响应智能体崩溃后无法恢复、多步骤工作流没有审计追踪——这些问题都会阻碍智能体上线。LangSmith 部署的 MongoDB 检查点(Checkpointer)通过将智能体状态直接持久化到 MongoDB 来解决这些问题。你获得多轮对话记忆、人机协同(Human-in-the-Loop)审批工作流、时间旅行调试(可回放任何先前状态)和容错执行。该检查点支持自托管 LangGraph 部署,也可作为 LangSmith 部署中的可配置后端。你只需设置 LS_DEFAULT_CHECKPOINTER_BACKEND,指向你的 Atlas 集群,智能体状态就会持久化在与应用数据相同的数据库中。

Text-to-MQL 实现运营数据的自然语言查询。 我们看到最常被请求的模式之一是:智能体能够查询结构化业务数据,而无需为每个问题编写自定义 API 端点。Text-to-MQL 集成将纯英文转换为 MongoDB 查询语言(MQL),让智能体自主查询运营和分析数据。一个对话式分析智能体可以处理类似“显示过去 30 天所有有发货延迟的订单”的问题,并将其转换为正确的 MQL 聚合管道。无需自定义集成代码。

构建 Text-to-MQL 管道,全面洞察推理、规划和工具调用

LangSmith 提供全栈可观测性。 LangSmith 端到端追踪每个智能体运行,包括 MongoDB 检索调用、工具调用(Tool Invocations)、智能体路由决策和检查点写入。当智能体返回错误答案时,你可以回溯确切的检索结果、模型的推理过程以及导致输出的状态转换。对于在生产环境中运行智能体的团队,这区别在于盲目调试和能够精确定位问题是检索质量、提示行为还是状态管理边缘情况。LangSmith 的评估工具,包括 LLM 作为评判者(LLM-as-judge)、人工审查和成对比较,层层叠加,让你能够长期衡量和改进智能体质量。

零锁定。 组合栈支持任何 LLM 提供商,在任何云(AWS、Azure、GCP)上运行,并支持 Atlas 云部署和自管理的 MongoDB Enterprise Advanced。Deep Agents、LangGraph 和 LangChain 都是开源的。你不会被锁定在单一供应商的 AI 生态系统中。

团队在构建什么

这些集成已在多个行业投入生产。以下是两个例子:

Kai Security 是一家网络安全公司,也是 MongoDB 客户,他们希望在安全工作流中加入 AI 智能体,但一直受限于基础设施。持久化智能体状态意味着要搭建一个独立的数据层,而他们的安全团队并不拥有或运营该层。LangSmith 部署的 MongoDB 检查点完全消除了这个障碍。他们在一天内实现了暂停恢复、崩溃恢复和完整审计追踪,而不是花一个月时间做架构决策,所有操作都在他们已信任的基础设施内完成。

财富 500 强企业的团队已经在使用 LangChain 和 MongoDB 构建智能体工作流,从金融服务和医疗保健领域的自动化合规与监管受理,到大规模驱动 AI 驱动的安全运营和客户体验平台。我们正与其中几家公司合作,将这种集成引入生产环境,并很快会分享这些故事。

产品如何连接

集成涵盖开源和 LangSmith:

开源集成:

  • Atlas Vector Search 检索器(Python 和 JavaScript),用于语义、混合和 GraphRAG 查询
  • 混合搜索,在单个 Atlas 查询中结合关键词全文搜索和向量相似性
  • Text-to-MQL 工具包,用于 MongoDB 数据的自然语言查询
  • RAG 评估管道,用于衡量检索质量和答案准确性

LangSmith 集成:

  • LangSmith 部署代理服务器的 MongoDB 检查点,用于通过 LangSmith 部署时将智能体状态持久化到 MongoDB(支持 Atlas 云、自管理和捆绑开发实例)
  • LangSmith 可观测性的端到端追踪,覆盖 MongoDB 检索调用、工具调用和全流程的智能体决策

“LangChain 和 MongoDB 的开源集成已经有一段时间了,从 Atlas Vector Search 检索器到 Text-to-MQL 工具包。现在有了 LangSmith 的 MongoDB 检查点,团队可以将智能体状态直接持久化到 Atlas,获得崩溃恢复、时间旅行调试和持久化执行,开箱即用。结合 LangSmith 的可观测性、评估管道和托管部署,MongoDB 客户现在有了从原型到生产智能体的完整路径,无需离开他们已信任的基础设施。”

– Harrison Chase, LangChain 联合创始人兼 CEO

“AI 智能体的可靠性取决于其背后的数据基础设施。与 LangSmith 和 LangChain 的集成为 MongoDB Atlas 客户提供了一条从现有运营数据到生产 AI 智能体的直接路径,向量搜索、持久化状态和自然语言查询都内置在他们已运行的平台中。AI 采用就应该这样:附加而非破坏。”

– Chirantan “CJ” Desai, MongoDB 总裁兼 CEO

如何开始

所有集成现已生产就绪。


关于 LangChain

LangChain 是驱动顶级工程团队的智能体工程(Agentic Engineering)平台,从 AI 初创公司到全球企业。其开源框架,包括 LangChain、LangGraph 和 Deep Agents,累计下载量已超过 10 亿,被超过 100 万从业者使用。LangSmith 是可观测性、评估和部署平台,服务超过 300 家企业和 5 家财富 10 强公司。LangChain 由 Sequoia Capital、Benchmark 和 IVP 支持。更多信息,请访问 langchain.com

加入我们的通讯

来自 LangChain 团队和社区的更新

输入你的邮箱

处理中...

成功!请检查你的收件箱并点击链接确认订阅。

抱歉,出错了。请重试。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论