LLM 추론 제공자 모음 — 저지연·커스텀 가중치·게이트웨이
Groq, Cerebras, SambaNova, Together, Fireworks, OpenRouter, LiteLLM 등.
이 모음의 도구
- Groq
Groq: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - Cerebras Inference
Cerebras 웨이퍼 스케일 추론. 주요 OSS LLM에서 극한 토큰 처리; 인터랙티브 앱에 유리, 모델 목록은 공식 사이트.
추론 / 호스팅 - SambaNova Cloud
SambaNova Cloud: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - Together AI
Together AI: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - Fireworks AI
Fireworks AI: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - OpenRouter
OpenRouter: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - LiteLLM
오픈소스 LLM 프록시 게이트웨이. OpenAI 호환 API 하나로 100+ 벤더 통합—라우팅·예산·폴백·로그까지.
추론 / 호스팅 - Replicate
Replicate: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - fal
fal: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - Modal
Modal: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - Baseten
Baseten: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅 - 硅基流动 SiliconFlow
硅基流动 SiliconFlow: 인기 AI 제품—기능·가격·지원 지역·데이터 처리·최신 모델은 공식 사이트를 확인하세요.
추론 / 호스팅