支配剧场| 这里有用过sovits 4.0的人偶吗?遇到了怪事
正常情况来说模型训练的效果是随着步数增长而出现一个高峰,也就是步数不能太少也不能过头,大部分人在10w左右就可以达到完美的效果,然而我在训练到约六万步的时候依然存在严重的电音现象,于是就进一步增加,直到10w步,然而并没有改变,甚至加重,终于在13w步的时候其漏电情况甚至比起初还要严重……
所以这是和音源的情况有关吗?如果音源气音严重会导致训练模型的电音率高(可是别人训好的模型即便有气音也没有漏电这么多的)?还是说这是样本较少的结果(我大概投喂了八百多个短于十秒的语音)?
不知道这儿有没有精通此物的人偶解答一下情况……
虎扑JR0985609198
· 江苏数据集的质量不高吧,除了人声还有其他杂音
百裂冲击
· 天津模型质量我觉得别说十万步了 砍一半也没什么大变化了电音主要是干音质量不好 带混响进去推理就这样