2026-04-2112 個條目
LLM 推論服務清單 — 低延遲、自訂權重、聚合網關
Groq、Cerebras、SambaNova、Together、Fireworks、OpenRouter、LiteLLM 等。
提供推論價格、速度、資料路由與相容性的比較起點;請以官網為準。
本合集收錄的工具
- Groq
Groq:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - Cerebras Inference
Cerebras 晶圓級推論服務,對主流開源 LLM 宣稱極速 token 吞吐;延遲敏感互動型應用首選,模型清單以官網為準。
推論 / 託管 - SambaNova Cloud
SambaNova Cloud:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - Together AI
Together AI:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - Fireworks AI
Fireworks AI:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - OpenRouter
OpenRouter:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - LiteLLM
開源 LLM 聚合代理:以單一 OpenAI 相容 API 接上百家供應商,支援路由、預算、fallback 與日誌,不必重造基礎設施。
推論 / 託管 - Replicate
Replicate:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - fal
fal:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - Modal
Modal:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - Baseten
Baseten:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管 - 硅基流动 SiliconFlow
硅基流动 SiliconFlow:常見的 AI 產品——功能、價格、支援地區、資料處理與最新模型,請以官網說明為準。
推論 / 託管