输入“/”快速插入内容

GPT-SoVITS一分钟素材AI语音克隆

2024年4月11日修改
❤️
GPT-SoVITS是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音,部署方便,训练速度很快,效果很好,项目发布不到1个月就有了9.3k star。
下面讲3种使用方式:
使用colab(需要魔法,免费)
使用AutoDL(在线付费租网卡,方便)
本地部署(硬件要求高)
使用colab
使用条件:
能够魔法上网
一个谷歌账号
使用推荐的浏览器(✅Chrome / Edge / Firefox)
关闭浏览器自带的网页翻译功能
这个界面类似于电脑的控制台,各种信息都会出现在这上面。如果运行失败,这上面也会有报错信息,靠着报错信息去解决问题。
如果是Chrome浏览器已经登陆账号的,那么就会自动登陆。没登陆的点击右上角登陆谷歌账号即可使用。
点击环境配置的开始键,跳出警告点仍然运行。显示是运行中>
,一直在转圈,不要动。出现一行黄字就代表完成了,如果中途跳出让你切换为标准模型,不要点!请始终使用GPU模式!
3.下载预训练模型
还是点这开始,稍微等待一会……
4.上传音频
在等待的时候可以先上传好所需的音频。点击第一个键上传音频,上传的速度取决于你梯子的上传网速。
上传的过程中左下角会有这个圈
消失后就是上传完成了。
新建一个文件夹,建议命名input,将音频拖进去。
5.开启WebUI