2026-04-2112 件

LLM 推論プロバイダ一覧 — 低遅延・カスタム重み・ゲートウェイ

Groq、Cerebras、SambaNova、Together、Fireworks、OpenRouter、LiteLLM 等。

「LLM 推論料金」等の検索に対応した比較ハブ。料金・互換性は各公式で確認してください。

このまとめのツール

Groq
Groq: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
Cerebras Inference
Cerebras ウェハースケールの推論。主要OSS LLMで極速のトークン吞吐。対話型用途に最適、モデル一覧は公式で確認。
推論 / ホスティング
SambaNova Cloud
SambaNova Cloud: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
Together AI
Together AI: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
Fireworks AI
Fireworks AI: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
OpenRouter
OpenRouter: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
LiteLLM
OSS の LLM 代理ゲートウェイ。OpenAI 互換 API 一本で百超のベンダを統合、ルーティング／予算／フォールバック／ログまで。
推論 / ホスティング
Replicate
Replicate: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
fal
fal: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
Modal
Modal: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
Baseten
Baseten: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング
硅基流动 SiliconFlow
硅基流动 SiliconFlow: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
推論 / ホスティング