2026-04-218 个条目
向量数据库选型对比 — 为 RAG 挑一条顺手的检索底座
Pinecone、Weaviate、Qdrant、Chroma、Milvus、LanceDB、Turbopuffer 速查:吞吐、过滤、托管形态一眼看完。
对应「向量数据库对比」「Pinecone vs Qdrant」「自建 RAG」等搜索意图。核心差异在吞吐、带过滤的召回质量、metadata 模型、多租户、Serverless 与自部署的取舍。
本合集中立列出,便于作为选型起点;定价、备份与区域部署请在各自官网核对。
本合集收录的工具
- Pinecone
托管型向量数据库老牌玩家,提供 Serverless 版本与命名空间隔离,适合生产级 RAG 快速上线。定价按存储与查询计费,规模上去后建议评估 Qdrant / Milvus 等替代。
向量库 / 检索 - Weaviate
开源向量数据库,内置模块化的嵌入与混合检索,支持 Cloud 与自部署,适合需要 BM25 + 向量混合检索的业务。运维成本略高,建议搭配自己的监控栈。
向量库 / 检索 - Qdrant
Rust 编写的开源向量数据库,提供本地、云与企业版本,支持 payload 过滤、混合搜索与量化压缩,适合对内存占用与吞吐敏感的生产环境。
向量库 / 检索 - Chroma
开发者友好的开源向量数据库,几行 Python 即可本地跑起来,适合原型、笔记本实验与小规模 RAG。线上大规模时建议切换到更偏运维的方案。
向量库 / 检索 - Milvus / Zilliz
Milvus 是 LF AI & Data 托管的开源向量数据库,面向亿级以上规模;Zilliz 提供其托管云版本。适合大数据量 RAG、向量搜索与图片/视频 Embedding 检索。
向量库 / 检索 - LanceDB
基于 Lance 列式格式的嵌入式向量数据库,与 pandas / PyArrow 无缝协作,可直接放到对象存储,适合数据科学笔记本与离线评测流水线。
向量库 / 检索 - Turbopuffer
基于对象存储的 Serverless 向量数据库,主打低成本 + 过滤查询,适合预算敏感的团队做大批量文档 RAG。写入与查询延迟特性请在你自己的数据集上实测。
向量库 / 检索 - Jina AI
提供嵌入、重排序与 Reader 等面向 RAG 的基础设施,开源组件丰富,适合自建搜索与问答流水线。企业部署需评估延迟与缓存策略。
向量库 / 检索