カテゴリ
Voice agents & realtime AI — phone, support, and live conversation stacks
Vapi, Retell, Bland, LiveKit Agents, Cartesia, Hume, Deepgram, Pipecat and more—build AI that can pick up the phone.
Voice agents exploded in 2025: chain **STT + LLM + TTS + telephony/WebRTC** to run front-desk, pre-sales, scheduling, and follow-ups. Four things decide the build: **end-to-end tail latency** (target < 700ms), **barge-in and turn-taking**, **regional numbering and compliance** (TCPA, two-party consent), and **hosted vs self-built**. On TTS, judge realism and voice-clone licensing; on STT, stress-test noise and accents.
編集用 / GSC 追記欄
Vapi vs Retell vs Bland
Vapi and Retell are dev-first and let you swap STT/LLM/TTS. Bland is more batteries-included. Record a real script and run 50 calls through each before committing.
How do you get low latency with barge-in?
You need VAD plus duplex audio, streaming STT, streaming LLM, and streaming TTS. LiveKit Agents and Pipecat are popular plumbing; Cartesia and ElevenLabs drive the TTS-side latency that makes conversations feel natural.
Compliance and disclosure duties?
Most jurisdictions require consent before recording/transcription. Outbound phone work also involves numbering rules, holiday/time windows, and do-not-call lists—get local counsel.
このカテゴリのツール
概要と公式リンクは各ツール詳細へ。カテゴリ内の関連ピックも参照してください。
開発者志向のボイスエージェント基盤。STT/LLM/TTS を自由に組み合わせ、電話番号も利用可、分課金。
低遅延と自然な割り込みに注力したボイスエージェント。ビジュアル編成と番号レンタル、呼入/外呼テンプレあり。
Bland AI: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
LiveKit Agents: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
低遅延 TTS(Sonic 系)。ストリーミング API とカスタム音声。自然なボイスエージェント/音声プロダクト向け定番。
Hume AI: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
Deepgram: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。
Pipecat: 人気のAI製品です。機能・料金・対応地域・データ取り扱い・最新モデルは公式サイトで確認してください。