Stuart:一夜爆火的 ChatTTS 实测
Stuart:一夜爆火的 ChatTTS 实测
2024年6月20日修改
🎼
作者: 许键Stuart
ChatTTS 一夜爆火, 极速出圈, 3 天就斩获 9k 的 Star 量, 截止 2024.06.03, 已经 16.6k 的 star, 极速接近 GPT-soVITs 当天的 26.2k 的 star 数。 到底有什么魔力让它火爆的速度直追它的前辈?
🤖
优势:
•
真实度和自然度很惊艳
•
更好的韵律: 能生成接近真人音色的语气语调
•
这个TTS应该是目前对中文支持最好的了
•
中英混合也没问题
•
细粒度控制: 能够预测和控制细粒度的韵律特征,如笑声、停顿和插话等
•
自然流畅的语音合成,同时支持多说话人
•
同时提供预训练模型
🤖
劣势:
•
当前推理速度慢,无法应用在实时语音场景。用在离线场景,需要大量的后期修正工作。
•
对于阿拉伯数字,标点符号,refine后效果不太好
•
有时候会出现不稳定,自动删除或者增加一些内容在句子里比如输入的内容是“你吃饭了没”,会莫名把句子改写一下变成了,“好吃,你吃饭了没”这种情况
•
读绕口令也有人的那种卡顿(效果不稳定)
相关介绍
•
•