Langfuse

开源的 LLM 可观测与评测平台,支持 trace、数据集、评分器与 prompt 管理,可 Docker 自部署把数据留在内网。面向重视数据主权或需要私有化部署的团队是口碑选项。

评测 / 可观测开源自部署Trace
访问官网新窗口打开

更适合

想开源自托管 / 可 audit 的 LLM 可观测方案;中等规模产品需要统一 trace、prompt 管理与离线 eval 的团队。

不太适合

完全不想自部署、也不愿接受 OSS 维护成本的团队;或只跑极小流量、用官方 dashboard 就够的场景。

对比时可看

与 LangSmith / Helicone / Phoenix 对比:Langfuse 最大优势是 OSS 和数据主权;但 UI/生态深度相比闭源 SaaS 仍需自己补。

选用前自检

  • 评估自托管资源与升级节奏
  • 定义 prompt version + trace + eval 的一条主线
  • 把线上 trace 采样和线下 golden set 打通
  • 准备 SSO / RBAC / PII 策略

常见检索问题

Langfuse 自托管复杂吗?

官方提供 Docker Compose 与 Helm,单节点起步几十分钟。主要复杂度在后续:Postgres/ClickHouse 的备份、模型成本表的维护、多租户 RBAC。生产上线前至少跑一次灾备演练。

使用场景

以上介绍帮助你判断这款工具是否适合当前需求。同类工具较多时,建议先明确自己的使用频率、预算与对数据隐私的要求,再选择最顺手的一款。

同类工具