2026-04-2112 个条目

LLM 推理平台一览 — 低延迟、自定义权重、聚合网关

Groq、Cerebras、SambaNova、Together、Fireworks、OpenRouter、LiteLLM、Replicate、fal、Modal、Baseten、硅基流动:在哪跑模型不头疼。

对应「LLM 推理价格」「最快的大模型 API」「OpenAI 备胎」等搜索。本合集覆盖三种形态:**低延迟专用芯片**(Groq / Cerebras / SambaNova)、**聚合网关**(OpenRouter / LiteLLM)、**自定义权重 Serverless**(Together / Fireworks / Replicate / Modal / Baseten)。 不做排名;对照你要跑的模型、数据路由要求与是否需要 OpenAI 兼容接口,再决定主备栈。

本合集收录的工具