输入“/”快速插入内容

GPT-SoVITS一分钟素材AI语音克隆

2024年4月11日修改

❤️

作者：Lucas AI

原文：https://mp.weixin.qq.com/s/GLVyaPFO9sJ_zFYHL35Drg

GPT-SoVITS是一个开源的TTS项目，只需要1分钟的音频文件就可以克隆声音，支持将汉语、英语、日语三种语言的文本转为克隆声音，部署方便，训练速度很快，效果很好，项目发布不到1个月就有了9.3k star。​
​
下面讲3种使用方式：​
使用colab（需要魔法，免费）​
使用AutoDL（在线付费租网卡，方便）​
本地部署（硬件要求高）​

使用colab

使用条件：

能够魔法上网

一个谷歌账号

使用推荐的浏览器（✅Chrome / Edge / Firefox）

关闭浏览器自带的网页翻译功能

点击GPT-SoVITS的colab链接：https://colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb

这个界面类似于电脑的控制台，各种信息都会出现在这上面。如果运行失败，这上面也会有报错信息，靠着报错信息去解决问题。​

如果是Chrome浏览器已经登陆账号的，那么就会自动登陆。没登陆的点击右上角登陆谷歌账号即可使用。​

点击环境配置的开始键，跳出警告点仍然运行。显示是运行中>​

，一直在转圈，不要动。出现一行黄字就代表完成了，如果中途跳出让你切换为标准模型，不要点！请始终使用GPU模式！​

common.docs_name - LarkCCM_Docs_Menu_Image

3.下载预训练模型

还是点这开始，稍微等待一会……

4.上传音频

在等待的时候可以先上传好所需的音频。点击第一个键上传音频，上传的速度取决于你梯子的上传网速。​

上传的过程中左下角会有这个圈

消失后就是上传完成了。

新建一个文件夹，建议命名input，将音频拖进去。

5.开启WebUI

GPT-SoVITS一分钟素材AI语音克隆​

GPT-SoVITS一分钟素材AI语音克隆