Stuart:一夜爆火的 ChatTTS 实测

2024年6月20日修改
🎼
作者: 许键Stuart
ChatTTS 一夜爆火, 极速出圈, 3 天就斩获 9k 的 Star 量, 截止 2024.06.03, 已经 16.6k 的 star, 极速接近 GPT-soVITs 当天的 26.2k 的 star 数。 到底有什么魔力让它火爆的速度直追它的前辈?
🤖
优势
真实度和自然度很惊艳
更好的韵律: 能生成接近真人音色的语气语调
这个TTS应该是目前对中文支持最好的了
中英混合也没问题
细粒度控制: 能够预测和控制细粒度的韵律特征,如笑声、停顿和插话等
自然流畅的语音合成,同时支持多说话人
同时提供预训练模型
50%
🤖
劣势:
当前推理速度慢,无法应用在实时语音场景。用在离线场景,需要大量的后期修正工作。
对于阿拉伯数字,标点符号,refine后效果不太好
有时候会出现不稳定,自动删除或者增加一些内容在句子里比如输入的内容是“你吃饭了没”,会莫名把句子改写一下变成了,“好吃,你吃饭了没”这种情况
读绕口令也有人的那种卡顿(效果不稳定)
50%
相关介绍
ChatTTS:专门为对话场景设计的文本到语音TTS模型,支持中英文 https://xiaohu.ai/p/8702
利用 Whisper + DeepSeek + ChatTTS 构建语音对话机器人 https://mp.weixin.qq.com/s/7bCUAk-Q1LDmX70iy5Tt8w