分類

Vector DBs & retrieval — pick the base layer for RAG

Vector databases, embeddings, rerankers, and memory layers—compare the stack that feeds your RAG and agents.

Unlike chat LLMs, retrieval stacks differ mostly on **throughput, recall quality, filtering, and ops shape**. Split the short list into serverless (Pinecone, Turbopuffer) vs self-hosted (Milvus, Qdrant, Weaviate, Chroma, LanceDB), then check hybrid search (BM25 + vectors), metadata filters, namespaces, and per-tenant auth. Embedders and rerankers (Jina, Cohere, OpenAI) plug in as independent layers.

檢索與補充說明

Pinecone vs Qdrant vs Weaviate vs Milvus

Small teams chasing speed: Pinecone/Turbopuffer. Self-host camp: Qdrant/Milvus. Local evals and dev: Chroma/LanceDB. Past 100M vectors, ops cost and backup story dominate the choice.

Do I need a reranker?

If your Top-K retrieval is noisy and answers drift, a cross-encoder rerank is often cheaper than swapping embeddings. Cohere Rerank, Jina Reranker, and bge-reranker are common picks.

Do agents need long-term memory?

Most apps get by with session state plus RAG. Only reach for Mem0 or a custom memory layer when you truly need cross-session personalization—and design deletion and audits up front.

本類工具

簡介與官網以各工具詳情頁為準;可在同類條目間交叉瀏覽。

Tavily

Tavily:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
Jina AI

Jina AI:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
Mem0

Mem0:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
Pinecone

託管型向量資料庫,提供 Serverless 方案與命名空間;RAG 上線快,規模變大時再與 Qdrant/Milvus 自部署比較成本。

向量資料庫 / 檢索
Weaviate

Weaviate:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
Qdrant

Rust 打造的開源向量資料庫,附雲端與企業版;payload 過濾、混合搜索與量化壓縮兼顧記憶體與吞吐。

向量資料庫 / 檢索
Chroma

Chroma:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
Milvus / Zilliz

Milvus / Zilliz:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
LanceDB

LanceDB:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索
Turbopuffer

Turbopuffer:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。

向量資料庫 / 檢索