一分钟复制你的声音 AI声音克隆GPT-SoVITS轻松复克你喜欢的声音

.:. 草榴社區 » 技術討論區 » 一分钟复制你的声音 AI声音克隆GPT-SoVITS轻松复克你喜欢的声音
	回帖發布主題

本頁主題: 一分钟复制你的声音 AI声音克隆GPT-SoVITS轻松复克你喜欢的声音	字體大小寬屏顯示只看樓主最新點評熱門評論時間順序

weichaong

級別：新手上路 ( 8 )
發帖：142
威望：17 點
金錢：287 USD
貢獻：0 點
註冊：2022-02-10

資料短信推薦編輯

【小白教程】GPT-SoVITs-v2从零开始训练声音克隆教程

GPT-SoVITS是一个开源的声音克隆项目，该语音合成工具结合了GPT模型和SoVITS变声器技术，仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换。该工具特别适用于需要快速生成特定人声的场景，可以帮助用户在没有或只有少量目标说话人语音样本的情况下，训练出能够模仿该说话人声音的模型。，支持中、英、日、韩、粤物种语种，现在1分钟的参考音频就能训练出很好的效果。跟着这个教程操作一遍你也能配出你想要的声音了

找到软件包解压在没有中文路径的文夹内。
找到go-webui.bat 双击运行，

稍等片刻即可启动webUI界面 .

直接到语音切分工具项目，

在音频自动切分输入路径。框内。填上想要复刻声音的音频的路径.。没有音频的话现做一个。
打开微信小程序，搜出配音神器这个小程序，做出一个没有杂音的纯声音。

随便找段文子粘帖进来，然后选择一个你喜欢的声音，点合成。不是会员有字数限制，一次不能超过一千字。合成后下载到电脑上。
回到软件，把合成好的音频路径复制粘帖框内。输出路径默认不用动，这些数值不懂就不要改它们，保持默认就行。点击开启语音切割。就会把音频切成一段一段的。切好的音频在这个output\slicer_opt文件夹里。这个音频纯没有杂音直接到到第三步离线批量asr。

找到刚切割好的音频文件夹右键复制文件夹地址。粘贴到文件夹路径内，有引号的把前后的引号删掉。其它不用动，就可以开启离线批量asr。

看到这面框里asr任务完成就可以进行下一步打标了。就是检查切割的音频和文字停顿对不对。

在是否开启打标webui前打勾，等待一会就打开另一个页面。

每句都有听都要对前面的文字对不对。就是这个地方比较费时间，要耐心检查好。有修改的话修改一次就点一下上面的提交文本，很重要，太长的超过十秒的音频或大短的音频或音不准的就删掉。
这一页检查完后点下一页继续检查。太长的超过十秒的音频删掉。所以每个修改都要点提交文本保存一下。
全部检查完好后关闭这个页面。还要把打标的的勾去掉。

再回到页面上这个地方开启下一步。这里打上模型名称。点击最下面的开启一键三连。

一键三连结束后接着下一个节目。在1A的边上点开1B微调训练，

参数默认，要是显存低的话就修改前面第一个数。点击开启SoVITS训练。

页面看不出反应去后台看看。训练快慢由电脑性能决定。

只有一张显卡的话要等到SoVITS训练完成，再开启gpt训练。

来后台看看gpt也是一会儿就好了，

训练好的模型在GPT_weights_v2和SoVITS_weights_v2这两个文件夹里。要是你的是第一版本的话就在GPT_weights和SoVITS_weights文件夹。到此我们想要的声音就克隆好了
我们用刚做好的模型来配个音试试。

点击最后一个IC推理。选择要用的模型。没找到刚才命名的模型没关系，点旁边的刷新刷新一下模型库。就能看到了，

在这里打勾就能打开推理页面，

这里要放入一段十秒内的参考音频。就用刚才切割的音频就可以，开启文字参考输入文字。输入要合成的文字。

点击合成。就能复制好喜欢的声音了。
收集了一些网络主播声音模型.欢迎试用

【下载地址】：GPT-SOVITS

DMCA / ABUSE REPORT | TOP Posted: 11-23 16:55 發表評論

.:. 草榴社區 » 技術討論區

一分钟 复制你的声音 AI声音克隆GPT-SoVITS轻松复克你喜欢的声音

一分钟复制你的声音 AI声音克隆GPT-SoVITS轻松复克你喜欢的声音