人声分离 是一项重要的音频处理技术,它可以将混合音频中的 人声和背景音乐 分离出来,为音频处理和后期制作提供了便利。
随着人声分离技术的发展,越来越多的开源工具被开发出来,为音频处理领域带来了新的发展机遇。小编之前也体验过不少人声分离
开源项目工具。分离效果有好的,有差的,参差不齐。
今天分享开源的人声分离工具,本站已经制作整合包,Windows系统可以一键启动。vocal-separate
此外,你还可以选择分离“钢琴声”、“贝斯声”、“鼓声”等单独音轨。操作简单,只需两步:选择音视频文件,点击启动处理,即可完成。而且,工具已内置模型,无需连接互联网下载,直接在本地浏览器中自动运行。
支持格式:
视频:mp4/mov/mkv/avi/mpeg
音频:mp3/wav
使用教程
下载后解压到某处,比如 E:/vocal-separate;(注意不要出现中文)双击 start.exe ,等待自动打开浏览器窗口即可;点击页面中的上传区域,在弹窗中找到想分离的音视频文件,或直接拖拽音频文件到上传区域,然后点击“立即分离”,稍等片刻,底部会显示每个分离文件以及播放控件,点击播放。
本地部署演示
使用也很简单,下面是演示,上传一首《幸福之家》
处理后结果:
伴奏:
人声:
稍微有点瑕疵,可以测试4stems或5stems模型,应该会有更好的效果。
注意事项
1.如果您的电脑配备了英伟达GPU,并且已经正确配置了CUDA环境,系统会自动启用CUDA加速,提高处理速度。
2. 如果您的电脑没有NVIDIA显卡或者没有配置CUDA环境,请不要选择4stems和5stems模型,尤其是在处理较长时长的音频时。否则,可能会导致内存耗尽,影响使用效果。
3. 对于中文音乐或中式乐器,我们建议您选择2stems模型。其他模型可以单独分离“钢琴、贝斯、鼓”等音轨。
下载地址:
独家启动包下载: