- GPT-SoVITS一分钟素材AI语音克隆
- 使用colab
- 3.下载预训练模型
- 4.上传音频
- 5.开启WebUI
- 6.数据集处理
- 6.1.使用UVR5处理原音频(如果原音频足够干净可以跳过这步,比如游戏中提取的干声)
- 6.1.1:方法1:使用自带的UVR5处理音频
- 6.2.切割音频
- 6.3.打标
- 6.4:校对标注(这步比较费时间,如果不追求极致效果可以跳过)
- 7.训练
- 7.1:输出logs
- 7.2:微调训练
- 8.推理
- 8.1:开启推理界面
- 8.2:开始推理
- 9.下载模型到本地
- 10.关机
- 11.本地推理
- 使用AutoDL
- 使用条件:
- 2:处理数据集
- 2.1:上传原音频
- 2.2:开启WebUI
- 2.3:UVR5提取人声
- 2.3.1:方法1:使用自带的UVR5处理音频
- 2.3.2:方法2:在本地电脑使用UVR5客户端(没有bug,可能性能需求会更高点)
- 警告:安装路径必须为全英文!!!不推荐修改默认安装路径,否则会有权限问题!!!
- 2.4:切分
- 2.5:打标
- 2.5.1:开启标注
- 2.5.2:校对(这步比较费时间,可以跳过)
- 3:训练
- 3.1:输出logs
GPT-SoVITS一分钟素材AI语音克隆
GPT-SoVITS一分钟素材AI语音克隆
2024年4月11日修改
GPT-SoVITS是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音,部署方便,训练速度很快,效果很好,项目发布不到1个月就有了9.3k star。
下面讲3种使用方式:
使用colab(需要魔法,免费)
使用AutoDL(在线付费租网卡,方便)
本地部署(硬件要求高)
使用colab
使用条件:
能够魔法上网
一个谷歌账号
使用推荐的浏览器(✅Chrome / Edge / Firefox)
关闭浏览器自带的网页翻译功能
点击GPT-SoVITS的colab链接:https://colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb
这个界面类似于电脑的控制台,各种信息都会出现在这上面。如果运行失败,这上面也会有报错信息,靠着报错信息去解决问题。
如果是Chrome浏览器已经登陆账号的,那么就会自动登陆。没登陆的点击右上角登陆谷歌账号即可使用。
点击环境配置的开始键,跳出警告点仍然运行。显示是运行中>
附件不支持打印
,一直在转圈,不要动。出现一行黄字就代表完成了,如果中途跳出让你切换为标准模型,不要点!请始终使用GPU模式!
附件不支持打印
加载失败,