[发明专利]基于堆叠沙漏网络的音乐源分离方法有效

专利信息
申请号: 202011118473.3 申请日: 2020-10-19
公开(公告)号: CN112259119B 公开(公告)日: 2021-11-16
发明(设计)人: 孙超 申请(专利权)人: 深圳市策慧科技有限公司
主分类号: G10L21/0272 分类号: G10L21/0272;G10L21/028;G10L25/18;G10L25/30
代理公司: 深圳市兰锋盛世知识产权代理有限公司 44504 代理人: 罗炳锋
地址: 518000 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 堆叠 沙漏 网络 音乐 分离 方法
【说明书】:

发明公开了一种基于堆叠沙漏网络的音乐源分离方法,包括步骤:S1、将原始混合语音信号经过分帧、加窗、傅里叶变换得到原始混合语音信号频谱图;S2、将原始混合信号幅度谱输入堆叠沙漏网络,经过堆叠沙漏网络后得到第一人声预测值和第一伴奏预测值;每个沙漏模块下采样第一次卷积后的输出通道等差式递增;S3、经时频掩模得到第二人声预测值和第二伴奏预测值,并得到预测人声信号和预测伴奏信号。与现有技术相比,本发明提供的音乐源分离方法,基于沙漏模块充分利用语音信号上下文之间的联系,从而提升了网络的分离效果,设计了等差式通道递增的结构,来弥补下采样语音谱图时产生的信息丢失,进一步提高了音乐源分离的效果。

技术领域

本发明涉及音乐源分离方法,具体是基于堆叠沙漏网络的音乐源分离方法。

背景技术

音乐源分离是自然语言处理下的一个重要分支,针对不同领域的具体要求,音乐源分离的目的可以是从混合信号中分离出人声或伴奏,也可以是从混合信号中分离出单个乐器的声音。分离后的信号源,在音乐检索领域上可进一步用于乐器识别、音高统计、音乐转录、歌词同步、歌手及歌词识别等应用。在语音识别领域上,可用于人声识别、关键词识别、语音情感识别等应用。随着有关机器学习和深度学习的研究,一系列神经网络在不断丰富和进化。为了有效地将一维的语音信号应用在CNN等神经网络中,可以先通过傅里叶变换将一维语音信号转换成二维幅度谱图,或者通过梅尔尺度滤波器转换成梅尔谱图或对数梅尔谱图。变换得到的二维图像,即可通过CNN或其他适用于信号处理的神经网络来进行训练。但是这些CNN网络深度上往往都比较浅,无法利用深度学习的优势来提取更深层次语音信号的特征,并且结构往往简单,无法处理更复杂的分离任务且分离效果不令人满意。

堆叠沙漏网络是是用来解决在人体姿态上的相关问题的一种神经网络,在堆叠沙漏网络中,每个阶段的沙漏模块都是一个简单的轻量级网络,包含自己的下采样和上采样路径,将前一阶段的沙漏网络按照端到端的方式首尾叠加起来就构成了堆叠沙漏网络。堆叠后的沙漏网络通过中间监督来保证网络各层参数的正常更新。堆叠沙漏网络的最初设计的目的是为了解决在人体姿态上的相关问题,它的重复推理的结构可以使得沙漏网络在人体关节的不同尺度上处理特征,并且捕获与身体关节相关的各种空间关系。它不仅有效地解决了人体姿态估计的难题,更重要的是为其他图像处理领域提供了一种新的思路和基体,很多占主导地位的网络结构正是基于堆叠沙漏网络上产生的不同变体。

发明内容

本发明的目的在于克服现有技术的神经网络结构语音分离效果较差的不足,提供了一种基于堆叠沙漏网络的音乐源分离方法,基于沙漏模块的上采样和下采样路径,随着四个阶段不同沙漏模块端到端式的堆叠,前一阶段沙漏模块学习到的语音特征信息作为下一个沙漏模块的输入,使得后一阶段的沙漏模块获得了更丰富的特征信息,可以更加充分利用语音信号上下文之间的联系,从而提升了网络的分离效果;同时针对沙漏网络编码部分的不足,在沙漏模块中设计了一种等差式通道递增的结构,来弥补下采样语音谱图时产生的信息丢失,进一步提高了音乐源分离的效果。

本发明的目的主要通过以下技术方案实现:

基于堆叠沙漏网络的音乐源分离方法,包括步骤:S1、将原始混合语音信号经过分帧、加窗、傅里叶变换得到原始混合语音信号频谱图,所述原始混合语音信号频谱图包括原始混合信号幅度谱和原始混合信号相位谱;S2、将原始混合信号幅度谱输入堆叠沙漏网络,所述堆叠沙漏网络包括四个以端对端的方式首尾堆叠的沙漏模块,原始混合信号幅度谱经过堆叠沙漏网络后得到第一人声预测值和第一伴奏预测值;每个沙漏模块下采样第一次卷积后的输出通道等差式递增;S3、将第一人声预测值、第一伴奏预测值结合时频掩模得到经过时频掩模后的第二人声预测值和经过时频掩模后的第二伴奏预测值;将第二人声预测值和第二伴奏预测值分别与原始混合信号相位谱结合,并分别经过逆傅里叶变换得到预测人声信号和预测伴奏信号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市策慧科技有限公司,未经深圳市策慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011118473.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top