200字
UVR5
2025-11-11
2025-11-12

处理方式:

Ensemble Mode:合奏模式

VR Architecture:个人用于分离和声与混响

MDX-Net:个人用于分离人声与伴奏

Demucs:没用过

(1)VR Architecture:

2个参数:

Windews Size:越小,效果就越好,占用的资源越大。常用有3种“1024低精换”,“512平均”,“320较好”。

Aggression Setting (力度设置):设置去除声音的力度,默认10,数值超过10可能导致非人声模型的乐器声变得浑浊。

常用模型:

4_HP:分离人声与伴奏

5_HP-Karokee-UVR.pth:将人声和其他声音分离(激进)

6_HP-Karaoke-UVR.pth: 将人声和其他声音分离(温和)

UVR-DeEcho-DeReverb:去混响降噪(激进)

UVR-De-Echo-Aggressive:去混响降噪(平均)

UVR-De-Echo-Normal:去混响降噪(温和)

UVR-DeNoice:去混响杂音

还要提一嘴,这个算法在分离人声时有可能会把ASMR中的人声当成背景音

(2)MDX-Net:

具有5种模式的模型,这些模型使用混合频谱/波形进行源分离(处理高音质音频的AI算法,对人声的识别提取能力强大,就是慢一些)

常用模型:均为可以分离人声与伴奏的模型

MDX23C-InstVoc HQ :分离人声与伴奏,很强但处理时间长(大概是现存最强的模型)

BS-Roformer-Viperx-1296:2024年3月末更新,需要beta版安装(可以代替MDX23C)与它同时更新的还有2个微调版本,可以自行下载体验。

UVR_MDXNET_1.onnx:在SDR上得分9.703

UVR_MDXNET_2.onnx:在SDR上得分9.682

UVR_MDXNET_3.onnx:在SDR上得分9.662,

UVR_MDXNET_main.onnx:据说很强

————————————————

原文链接:https://blog.csdn.net/2301_79607161/article/details/135057915

UVR5
作者
Tano
发表于
2025-11-11
License
CC BY-NC-SA 4.0

评论