GPT-SoVITS V3 lora版,支持50系显卡 业界最强的AI语音克隆、文本转语音软件 本地一键整合包下载
![]() GPT-SoVITS软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。
今天分享的GPT-SoVITS V3 lora版,同步官方最新的V3模型,零样本推理效果更好了。但运行需要8G显存,如显卡没有8G显存,请使用之前的版本。
软件下载后,解压出来,建议解压到非中文目录下,切记!
在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。 解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。模型训练更多操作,可以参考 GPT-SoVITS V2版
关于模型训练,可以参考V2版教程,这里只说下V3版的0样本推理,操作参考上图。
启动 一键推理.bat,然后按照上图操作即可。
UI最上方有官方的使用教程手册,想系统的学习可以参考:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
V3 lora版本特点
音色相似度更像,需要更少训练集来逼近本人(不训练直接使用底模的模式下音色相似性提升更大)
GPT合成更稳定,重复漏字(根据测试集实验指标)更少,也更容易跑出丰富情感
比v2更忠实于参考音频。微调场景下,v2比v3更受训练集整体平均影响,然后带一些参考音频的引导。
|
人工智能生成内容(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。
AIGC VIP部落 » GPT-SoVITS V3 lora版,支持50系显卡 业界最强的AI语音克隆、文本转语音软件 本地一键整合包下载
AIGC VIP部落 » GPT-SoVITS V3 lora版,支持50系显卡 业界最强的AI语音克隆、文本转语音软件 本地一键整合包下载