2026-04-2112 позиций

Провайдеры инференса LLM — низкая задержка, свои веса, агрегаторы

Groq, Cerebras, SambaNova, Together, Fireworks, OpenRouter, LiteLLM и др.

Ориентирован на запросы о ценах и скорости инференса; детали — на сайтах провайдеров.

Инструменты в подборке

Groq
Groq: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
Cerebras Inference
Инференс Cerebras на чипах wafer-scale с заявленной экстремальной пропускной способностью по известным OSS LLM; модели сверяйте на сайте.
Инференс / Хостинг
SambaNova Cloud
SambaNova Cloud: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
Together AI
Together AI: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
Fireworks AI
Fireworks AI: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
OpenRouter
OpenRouter: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
LiteLLM
OSS прокси-шлюз для 100+ провайдеров LLM через единый OpenAI-совместимый API: маршрутизация, бюджеты, fallback и логи.
Инференс / Хостинг
Replicate
Replicate: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
fal
fal: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
Modal
Modal: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
Baseten
Baseten: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг
硅基流动 SiliconFlow
硅基流动 SiliconFlow: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг