Pila de evals y observabilidad LLM — desplegar con confianza
LangSmith, Langfuse, Braintrust, Arize Phoenix, Helicone, Galileo, Patronus y más.
Herramientas en esta colección
- LangSmith
Plataforma de evals y traces de LangChain—datasets, scorers, monitoreo en vivo y revisión humana con la integración más profunda con LangChain/LangGraph.
Evaluación / Observabilidad - Langfuse
Plataforma open‑source de observabilidad y evals para LLM—traces, datasets, scorers y gestión de prompts; self‑host con Docker.
Evaluación / Observabilidad - Braintrust
Braintrust: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Evaluación / Observabilidad - Arize Phoenix
Arize Phoenix: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Evaluación / Observabilidad - Helicone
Helicone: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Evaluación / Observabilidad - Galileo
Galileo: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Evaluación / Observabilidad - Patronus AI
Patronus AI: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Evaluación / Observabilidad - Weights & Biases
Weights & Biases: producto de IA popular—consulta el sitio oficial para funciones, precios, regiones, datos y modelos actuales.
Aprendizaje / Datos
Servidores MCP relacionados
Configúralos en Claude, Cursor o Zed (cualquier cliente MCP) para que el agente acceda a herramientas externas, datos y entornos de ejecución.
- PostgreSQLOficial
Servidor MCP de referencia con acceso solo-lectura a Postgres e introspección de esquemas—ideal para agentes analíticos. Bloquea con un rol solo lectura y lista blanca de esquemas.
Base de datos / DatosstdioModel Context Protocol - SentryOficial
Sentry: servidor MCP oficial de Model Context Protocol—revisa versión, scopes de permisos y transporte en la documentación upstream antes de producción.
Nube / DevOpsstdioModel Context Protocol