ElevenLabs 已经成了"AI 配音选哪家"的默认答案——实测下来,这个名声是真材实料。和多数对手的自然度差距,一句话就能听出来。真正要想清楚的是两件事:按字符计费到底花多少钱,以及你需要哪一档克隆。
它最强的地方
TTS 质量是招牌:语调、停顿、情绪层次在我们测试的多数语言里都接近真人,API 友好也让它成为"会说话的产品"的标配。语音克隆分两档——即时克隆(一分钟素材、几分钟出结果,适合出样)和专业克隆(更长训练样本、贴合度明显更高,Creator 档起)。
定价拆解
| 档位 | 价格 | 积分/月 | 意味着什么 |
|---|---|---|---|
| Free | $0 | 10,000 | 约 10 分钟 TTS;需署名,不可商用 |
| Starter | 约 $5 | 30,000 | 商用授权 + 即时克隆 |
| Creator | 约 $22 | 约 100,000 | 专业克隆,192kbps 音质 |
| Pro | 约 $99 | 600,000 | 有声书/生产级用量 |
标准模型 1 积分≈1 字符,Flash/Turbo 约 0.5 积分/字符。核实于 2026-07-03,以官网为准。
要小心的是:按字符计费会悄悄滚雪球。一本 6 万词的有声书约 35 万字符——那是 Pro 档的一个月,不是 Starter 能扛的。按脚本长度做预算,别看标价。
三个注意点
克隆质量跟着素材质量走,录音带噪音就别怪模型;免费档产物不可商用,很多人栽在这里;克隆声音有明确的授权义务,只克隆你有权使用的声音。
结论
今天能买到的最好的原始音质,配一个奖励"会做预算的人"的计费模型。做配音的创作者和加语音功能的产品从 Starter/Creator 档起步即可。需要团队协作工作流看 Murf;主业是剪播客的话,Descript 每一块钱走得更远。