初创 / 快速上线
Pinecone
全托管零运维,Serverless 按量付费
最强过滤 / 自托管
Qdrant
Rust 高性能,ACORN 过滤算法领先
混合搜索最佳
Weaviate
向量+BM25 原生融合,内置向量化模块
十亿级规模
Milvus
DiskANN 磁盘索引,超大规模成本最优
已有 Postgres
pgvector
零额外基础设施,ACID 事务一致性
原型 / 开发
Chroma
嵌入式零配置,pip install 即用
🧠 2026 年关键趋势:纯向量搜索已不够。生产级 RAG 需要混合搜索(向量 + BM25 关键词),因为专有名词、编号、法条等无法被向量准确编码。Weaviate、Milvus 2.5+、Qdrant 1.9+ 已原生支持。Chroma 和基础 pgvector 尚不支持。
⚠️ 迁移成本警告:在云上将 1 亿向量从一个数据库迁到另一个,出站流量费用可能高达数千美元。最佳实践:始终将源向量存储在冷存储(S3/GCS/Parquet),这样可以直接从冷存储导入新数据库,而不用从旧数据库导出。