支配剧场| 这里有用过sovits 4.0的人偶吗?遇到了怪事

avatar
关注

正常情况来说模型训练的效果是随着步数增长而出现一个高峰,也就是步数不能太少也不能过头,大部分人在10w左右就可以达到完美的效果,然而我在训练到约六万步的时候依然存在严重的电音现象,于是就进一步增加,直到10w步,然而并没有改变,甚至加重,终于在13w步的时候其漏电情况甚至比起初还要严重……

所以这是和音源的情况有关吗?如果音源气音严重会导致训练模型的电音率高(可是别人训好的模型即便有气音也没有漏电这么多的)?还是说这是样本较少的结果(我大概投喂了八百多个短于十秒的语音)?

不知道这儿有没有精通此物的人偶解答一下情况……

崩坏3支配剧场
发布于辽宁阅读 3047

全部回复

discusser-avatar

虎扑JR0985609198

· 江苏

数据集的质量不高吧,除了人声还有其他杂音

亮了(0)
查看回复(1)
回复
discusser-avatar

百裂冲击

· 天津

模型质量我觉得别说十万步了 砍一半也没什么大变化了电音主要是干音质量不好 带混响进去推理就这样

亮了(0)
回复