Провайдеры инференса LLM — низкая задержка, свои веса, агрегаторы
Groq, Cerebras, SambaNova, Together, Fireworks, OpenRouter, LiteLLM и др.
Инструменты в подборке
- Groq
Groq: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - Cerebras Inference
Инференс Cerebras на чипах wafer-scale с заявленной экстремальной пропускной способностью по известным OSS LLM; модели сверяйте на сайте.
Инференс / Хостинг - SambaNova Cloud
SambaNova Cloud: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - Together AI
Together AI: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - Fireworks AI
Fireworks AI: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - OpenRouter
OpenRouter: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - LiteLLM
OSS прокси-шлюз для 100+ провайдеров LLM через единый OpenAI-совместимый API: маршрутизация, бюджеты, fallback и логи.
Инференс / Хостинг - Replicate
Replicate: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - fal
fal: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - Modal
Modal: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - Baseten
Baseten: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг - 硅基流动 SiliconFlow
硅基流动 SiliconFlow: популярный AI‑продукт — функции, цены, регионы, обработка данных и модели смотрите на официальном сайте.
Инференс / Хостинг