GPT-SoVITS V3版,业界最强的AI语音克隆软件,文本转语音、零样本推理,更强的V3模型 本地一键整合包下载

GPT-SoVITS V3版,业界最强的AI语音克隆软件,文本转语音、零样本推理,更强的V3模型 本地一键整合包下载
GPT-SoVITS软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。
今天分享的GPT-SoVITS V3版,同步官方最新的V3模型,零样本推理效果更好了。
软件下载后,解压出来,建议解压到非中文目录下,切记!
在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。
 
解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。模型训练更多操作,可以参考 GPT-SoVITS V2版
关于模型训练,可以参考V2版教程,这里只说下V3版的0样本推理,操作参考上图。
启动 一键推理.bat,然后按照上图操作即可。


UI最上方有官方的使用教程手册,想系统的学习可以参考:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
 
V3新增功能:
UVR5

1.将hp2模型替换为model_bs_roformer_ep_317_sdr_12.9755模型,大幅提升分离人声的效果
2.新增DeEchoNormal和DeReverb模型。去混响效果Normal<Aggressive<DeReverb
 

切分&降噪&打标&校对

1.自动填充路径
2.funasr增加粤语,whisper增加韩语和粤语标注功能。funasr的粤语标注更为准确
3.whisper可选推理精度,float16可以带来更快的推理速度
 

预处理

1.中文改为G2PW处理以优化多音字效果,但处理速度变慢了
2.优化了英文多音字效果,处理速度也变快了
 

训练

1.全新底膜,训练集增加到5k小时
2.增加韩粤两种语言
3.训练所需数据集更少
 

推理

1.zero shot效果大幅增强
2.中日英韩粤5个语种均可跨语种合成
3.对低音质参考音频合成出来音质更好
4.更好的文本前端,中英文加入多音字优化
5.增加语速调节
6.增加音色融合
 
暂无优惠 永久钻石免费

已有6人支付

人工智能生成内容(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。
AIGC VIP部落 » GPT-SoVITS V3版,业界最强的AI语音克隆软件,文本转语音、零样本推理,更强的V3模型 本地一键整合包下载

发表回复

提供最优质的资源集合

立即查看 了解详情