[发明专利]混合语音信号的分离方法、装置、存储介质及电子装置有效

专利信息
申请号: 201910736585.6 申请日: 2019-08-09
公开(公告)号: CN110491409B 公开(公告)日: 2021-09-24
发明(设计)人: 顾容之;陈联武;张世雄;徐勇;于蒙;苏丹;俞栋 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G10L21/0272 分类号: G10L21/0272;G10L21/0308
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 周婷婷
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 混合 语音 信号 分离 方法 装置 存储 介质 电子
【说明书】:

发明提供了一种混合语音信号的分离方法、装置、存储介质及电子装置,包括:获取语音采集装置采集到的混合语音信号,混合语音信号包括至少两个目标对象发出的语音;获取混合语音信号的频域特征形成的第一频域矩阵和所述混合语音信号的空域特征形成的第一空域矩阵;从至少两个目标对象中每两个目标对象与所述语音采集装置之间的夹角中确定角度最小的目标夹角;使用与所述目标夹角对应的权重系数对所述第一空域矩阵进行加权,得到第二空域矩阵;将第一频域矩阵和第二空域矩阵输入到目标神经网络模型,得到所述目标神经网络模型输出的从混合语音信号中分离出的与至少两个目标对象一一对应的多路语音信号。通过本发明,解决了目标夹角较小情况下,语音分离方法性能下降的问题。

技术领域

本发明涉及通信领域,具体而言,涉及一种混合语音信号的分离方法、装置、存储介质及电子装置。

背景技术

复杂场景下的语音识别及交互任务,往往面临着多人声混叠、房间混响等挑战,鲁棒的语音识别系统离不开前端的语音信号分离及增强模块。近来,面向复杂声学环境,基于深度学习的多通道语音分离方法受到学界和工业界的广泛关注。

当说话人在空间中分布较远时,说话人的空间位置差异较大,因此空域信息具有较大的区分性,有利于多通道分离网络分离语音,相对于只利用频域特征的单通道语音分离系统有明显性能提升。但是,当说话人之间较近时,他们之间相对于采集语音的麦克风阵列的夹角较小,此时空域特征将不再具有区分性。没有区分性的空域特征会混淆分离网络,导致性能明显差于单通道语音分离系统。

现有技术通过切换单通道和多通道语音分离系统的输出来解决该问题。通过判断当前混合语音中,说话人之间的空间位置是否重叠或相近,在重叠或相近的情况下,选择单通道语音分离系统对混合语音进行分离得到单通道分离结果;反之,选择多通道语音分离系统对混合语音进行分离得到多通道分离结果。但是,现有技术中的这种方法需要两套独立的系统,需要训练两个网络模型,并且需要运行判别网络,由此增加了系统的运行时间和计算复杂度。

针对相关技术中,目标夹角较小情况下,语音分离方法性能下降,尚不存在一个有效的解决方案。

发明内容

本发明实施例提供了一种混合语音信号的分离方法、装置、存储介质及电子装置,以至少解决相关技术中目标夹角较小情况下,语音分离方法性能下降的问题。

根据本发明的一个实施例,提供了一种混合语音信号的分离方法,包括:获取语音采集装置采集到的混合语音信号,其中,所述混合语音信号包括至少两个目标对象发出的语音;获取所述混合语音信号的频域特征形成的第一频域矩阵和所述混合语音信号的空域特征形成的第一空域矩阵;从所述至少两个目标对象中每两个所述目标对象与所述语音采集装置之间的夹角中确定角度最小的目标夹角;使用与所述目标夹角对应的权重系数对所述第一空域矩阵进行加权,得到第二空域矩阵,其中,0≤所述权重系数≤1;将所述第一频域矩阵和所述第二空域矩阵输入到目标神经网络模型,得到所述目标神经网络模型输出的从所述混合语音信号中分离出的与所述至少两个目标对象一一对应的多路语音信号,其中,所述目标神经网络模型是使用多组数据对原始神经网络模型训练出来的,所述多组数据中的每组数据均包括:至少两个目标对象发出的语音的频域特征矩阵和加权后的空域特征矩阵。

可选地,从所述至少两个目标对象中每两个所述目标对象与所述语音采集装置之间的夹角中确定角度最小的目标夹角,包括:确定第一中心位置与第一位置之间的第一连线与所述第一中心位置与第二位置之间的第二连线构成的第一夹角,其中,所述第一中心位置为所述语音采集装置的中心位置,所述第一位置为所述每两个所述目标对象中的第一目标对象所在的位置,所述第二位置为所述每两个所述目标对象中的第二目标对象所在的位置,所述每两个所述目标对象对应一个所述第一夹角;从所述至少两个目标对象中每两个所述目标对象对应的所述第一夹角中确定角度最小的夹角作为第一最小夹角,其中,所述目标夹角包括所述第一最小夹角。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910736585.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top