分类
语音代理与实时 AI丨电话、客服与实时对话栈
Vapi、Retell、Bland、LiveKit Agents、Cartesia、Hume、Deepgram、Pipecat 等:搭建可拨打电话的 AI。
语音代理是 2025 年爆发的品类:把 **STT + LLM + TTS + 电话 / WebRTC** 串起来,做前台、售前、预约、回访。选型看四件事:**端到端尾延迟**(目标 < 700ms)、**被打断处理**与对话轮转、**出海电话号码与合规**(TCPA / 双方同意)、**自建还是托管**。TTS 侧关注真实感与自定义声音的授权;STT 侧关注噪声和口音鲁棒性。
检索与补充说明
Vapi、Retell、Bland 怎么选?
Vapi / Retell 偏开发者灵活,可自选 STT/LLM/TTS;Bland 面向「上架即能打电话」的开箱方案。把你要打的真实业务录一段脚本,在三家各跑 50 通再看留存率。
实时打断与低延迟怎么做?
关键是 VAD + 双工音频 + 流式 STT + 流式 LLM + 低延迟 TTS。底层常用 LiveKit Agents / Pipecat;TTS 侧 Cartesia、ElevenLabs 的流式端到端延迟决定「感觉自然」的门槛。
合规与告知义务?
多数司法辖区要求告知或书面同意被录音与转写;出海电话业务还涉及号码归属、节假日、时段与反骚扰名单,务必以当地法务意见为准。
本类工具
简介与官网以各工具详情页为准;可在同类条目间交叉浏览。
面向开发者的语音代理平台,可自选 STT / LLM / TTS 供应商搭建电话与 WebRTC 语音机器人。定价按分钟计,适合搭建客服、预约与外呼机器人。
强调低延迟与自然打断的语音代理平台,提供可视化编排与电话号码租用,适合快速落地外呼/呼入场景。出海电话请关注合规与 Do-Not-Call 名单。
主打「一条链接就能打电话」的语音代理产品,模板化工作流上线快,企业版支持自建号码池与更严数据策略。复杂合规需求仍需走定制。
LiveKit 在自家 WebRTC 基础设施之上推出的开源语音代理框架,适合想自建实时语音应用、又不想自造 RTC 层的团队。可与任意 STT/LLM/TTS 串联。
Sonic 系列 TTS 为代表的低延迟语音合成厂商,强调流式 API 与自定义声音,适合对「自然感」敏感的语音代理与音频内容产品。
以情感与韵律研究切入的语音模型提供商,EVI 系列强调共情对话与情绪感知,适合心理、陪伴与客服等强共情场景。
老牌语音识别平台,Nova 系列 STT 在延迟与准确率上口碑稳,提供实时与批处理 API。语音代理栈里常作为 STT 层担当。
Daily 开源的实时多模态管道框架,把 STT、LLM、TTS、打断与 VAD 等组件以模块化方式串起来,适合想自建语音代理工程的团队。