[发明专利]基于带噪语音信号幅度谱动态压缩的波束形成方法及装置有效

专利信息
申请号: 202011324329.5 申请日: 2020-11-23
公开(公告)号: CN112533120B 公开(公告)日: 2022-04-22
发明(设计)人: 邱锋海;王之禹;项京朋 申请(专利权)人: 北京声加科技有限公司
主分类号: G10L21/0208 分类号: G10L21/0208
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁
地址: 100086 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语音 信号 幅度 动态 压缩 波束 形成 方法 装置
【说明书】:

本申请实施例公开了基于带噪语音信号幅度谱动态压缩的波束形成方法及装置,方法包括:对接收的来自传声器阵列的M个带噪语音信号在第l帧第k个频带的复频谱分别进行幅度谱动态压缩处理,获得M个动态压缩处理结果;其中,M为大于1的正整数,l和k为自然数;根据M个动态压缩处理结果,确定M个带噪语音信号在第l帧第k个频带的一个协方差矩阵;根据一个协方差矩阵,确定M个带噪语音信号在第l帧第k个频带对应的一个波束形成器;确定每个波束形成器输出的信号的复频谱,以确定时域的目标语音信号。本申请实施例提供的基于动态压缩处理MVDR波束形成器相比于传统MVDR波束形成器,不需要任何的对角加载,可降低离群值对传统MVDR波束形成器的影响,同时提高其鲁棒性和收敛性。

技术领域

本申请涉及语音增强技术领域,尤其涉及基于带噪语音信号幅度谱动态压缩的波束形成方法及装置。

背景技术

当前,随着微机电系统(Micro-Electro-Mechanical System,MEMS)技术工艺的进步,传声器尺寸越来越小,传声器之间的幅频响应和相频响应一致性也逐渐提高;进一步地,随着芯片制程的发展,芯片运算性能越来越强,功耗越来越低,这促进了MEMS传声器阵列的广泛应用。不管在智能家居,如智能音箱,还是在真无线立体声(True WirelessStereo,TWS)耳机,都普遍使用多个MEMS传声器组成阵列提高目标语音拾取性能。众所周知,采用传声器阵列进行目标语音提取,当目标语音和干扰噪声在空间上具有分离度时,理论上可通过空间滤波无失真地提取目标语音。

根据波束形成器的设计是否与传声器拾取的带噪语音信号相关,可将波束形成划分为固定波束形成和自适应波束形成。其中,固定波束形成包括延迟相加(Delay-And-Sum,DAS)、滤波相加(Filter-And-Sum,FAS)和超指波束形成(Super-Directive,SD)等;自适应波束形成则包括最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)和多通道维纳滤波(Multichannel Wiener Filter,MWF)等。当传声器阵列阵元数较少时,固定波束形成器难以形成较窄的主瓣以最大限度地抑制噪声。相比较而言,自适应波束形成往往具有更强的方向性干扰噪声抑制性能,因而受到更为广泛的关注和研究。

在目前的智能家居产品中,自适应波束形成,如MVDR有着重要的应用,其在点源噪声干扰抑制方面具有较强的性能。然而,MVDR存在鲁棒性问题,当噪声协方差矩阵估计存在信号协方差矩阵成分或者目标语音声学传递函数估计存在偏差时,会导致严重的目标语音失真,从而降低MVDR性能。为了提高MVDR鲁棒性,传统的方法包括固定对角加载技术、提高噪声协方差矩阵估计准确性的方法、提高目标语音声学传递函数估计性能的方法等。其中,固定对角加载技术运算复杂度最低,但是对角加载量大小难以自动确定,至今仍有学者在研究自动对角加载量技术;提高噪声协方差矩阵估计准确性的方法及提高目标语音声学传递函数估计性能的方法则运算复杂度较高,而且估计性能与目标语音的输入信噪比密切相关。当输入信噪比较低时,估计性能一般难以满足应用需求,依然存在语音失真问题。

发明内容

本申请实施例提出基于带噪语音信号幅度谱动态压缩的波束形成方法及装置。用以解决传统波束形成器鲁棒性较差、运算复杂度高的技术问题。该技术方案如下:

第一方面,本申请实施例提出基于带噪语音信号幅度谱动态压缩的波束形成方法,包括:

接收来自传声器阵列的M个带噪语音信号;其中,M为大于1的正整数;

对所述M个带噪语音信号在第l帧第k个频带的复频谱分别进行幅度谱动态压缩处理,获得M个动态压缩处理结果;其中,l和k为自然数;

根据所述M个动态压缩处理结果,确定所述M个带噪语音信号在第l帧第k个频带的一个协方差矩阵;

根据所述一个协方差矩阵,确定所述M个带噪语音信号在第l帧第k个频带对应的一个波束形成器;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声加科技有限公司,未经北京声加科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011324329.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top