Categoría

Vector DBs & retrieval — pick the base layer for RAG

Vector databases, embeddings, rerankers, and memory layers—compare the stack that feeds your RAG and agents.

Unlike chat LLMs, retrieval stacks differ mostly on **throughput, recall quality, filtering, and ops shape**. Split the short list into serverless (Pinecone, Turbopuffer) vs self-hosted (Milvus, Qdrant, Weaviate, Chroma, LanceDB), then check hybrid search (BM25 + vectors), metadata filters, namespaces, and per-tenant auth. Embedders and rerankers (Jina, Cohere, OpenAI) plug in as independent layers.

Editorial / GSC

Pinecone vs Qdrant vs Weaviate vs Milvus

Small teams chasing speed: Pinecone/Turbopuffer. Self-host camp: Qdrant/Milvus. Local evals and dev: Chroma/LanceDB. Past 100M vectors, ops cost and backup story dominate the choice.

Do I need a reranker?

If your Top-K retrieval is noisy and answers drift, a cross-encoder rerank is often cheaper than swapping embeddings. Cohere Rerank, Jina Reranker, and bge-reranker are common picks.

Do agents need long-term memory?

Most apps get by with session state plus RAG. Only reach for Mem0 or a custom memory layer when you truly need cross-session personalization—and design deletion and audits up front.

Herramientas en esta categoría

Los resúmenes y enlaces oficiales están en cada ficha; navega otras entradas de la misma categoría.

Tavily

Tavily: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
Jina AI

Jina AI: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
Mem0

Mem0: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
Pinecone

Vector DB gestionada con tiers serverless y namespaces—camino rápido a RAG; a gran escala compara coste con Qdrant/Milvus self-host.

Vector DB / Recuperación
Weaviate

Weaviate: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
Qdrant

Vector DB open source en Rust con nube gestionada y enterprise—filtro por payload, búsqueda híbrida y cuantización para memoria/rendimiento.

Vector DB / Recuperación
Chroma

Chroma: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
Milvus / Zilliz

Milvus / Zilliz: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
LanceDB

LanceDB: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación
Turbopuffer

Turbopuffer: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.

Vector DB / Recuperación