[发明专利]一种基于传声器阵列的波束形成方法和装置有效

申请号：	202110267335.X	申请日：	2021-03-11
公开（公告）号：	CN112802490B	公开（公告）日：	2023-08-18
发明（设计）人：	邱锋海;王之禹;项京朋	申请（专利权）人：	北京声加科技有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L21/0232;G10L19/26
代理公司：	北京亿腾知识产权代理事务所(普通合伙) 11309	代理人：	陈霁
地址：	100086 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于传声器阵列波束形成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种基于传声器阵列的波束形成方法及装置。该方案包括：将多通道语音时域信号以向量形式转换到频域中，获得向量形式的多通道语音频域信号；对多通道语音频域信号进行初始滤波，获得多通道初始目标语音频域信号；利用由加权带噪协方差矩阵构成的最小功率无失真响应滤波器对多通道语音频域信号进行迭代滤波，获得多通道目标语音频域信号；并在迭代过程中，根据上一次滤波的结果更新加权带噪协方差矩阵。本申请通过对最小功率无失真响应滤波器进行迭代更新，实现信号的迭代滤波，提升了滤波器的鲁棒性，还减小了目标语音的失真。

技术领域

本申请涉及语音处理技术领域，尤其涉及一种基于传声器阵列的波束形成方法和装置。

背景技术

随着硅微传声器的普及应用，传声器尺寸逐渐减少，幅频一致性不断提高。由多个传声器组成的传声器阵列相比于单传声器具有更强的方向性干扰抑制性能，因此，传声器阵列已经越来越广泛的应用在各种具有音频播放和采集的设备中。

传声器阵列波束形成属于宽带波束形成范畴，通常都需用通过快速傅里叶变换(fast fourier transform，FFT)将待处理的语音时域信号变换到频域中，然后在频域中对每个频带进行加权滤波，最后通过快速傅里叶逆变换(inverse fast fourier transform，IFFT)和重叠相加法(over lap-add，OLD)得到波束形成后的目标语音时域信号。对每个频带的信号进行滤波器(即滤波器)的设计是整个波束形成的关键，经典的方法有延迟相加(delay-and-sum，DAS)、滤波相加(filter-and-sum，FAS)、超指波束形成(super-directive，SD)等与传声器阵列拾取的信号无关的滤波器设计和优化方法，也有与传声器阵列拾取的信号相关的滤波器设计和优化方法如最小功率无失真响应(minimum powerdistortionless response，MPDR)以及多通道维纳滤波(multichannel wiener filter，MWF)等。

现有技术中采用上述滤波器对传声器阵列采集的信号进行波束形成时，由于设计滤波器时存在较大的估计误差，滤波器的鲁棒性较低，导致形成的目标语音信号存在失真问题。在对传声器阵列采集的语音信号进行波束形成时，如何使滤波器具有鲁棒性，提升波束形成性能，减少目标语音失真是目前应用中面临的主要问题。

发明内容

本申请实施例提供一种基于传声器阵列的波束形成方法和装置，在进行初始滤波之后，利用加权带噪协方差矩阵构成的最小功率无失真响应滤波器对传声器阵列采集的信号进行迭代滤波，提升了滤波器的鲁棒性，解决了现有技术中目标语音失真的问题。

第一方面，本申请实施例提供了一种基于传声器阵列的波束形成方法，该方法包括：

将多通道语音时域信号以向量形式转换到频域中，获得向量形式的多通道语音频域信号，多通道语音时域信号由传声器阵列采集；

对多通道语音频域信号进行初始滤波，获得多通道初始目标语音频域信号；

利用由加权带噪协方差矩阵构成的最小功率无失真响应滤波器对多通道语音频域信号进行迭代滤波，获得多通道目标语音频域信号；其中，当前迭代滤波的加权带噪协方差矩阵由上一次迭代滤波获得的语音频域信号估算的功率谱作为加权值对多通道语音频域信号逐个时频点进行加权确定，并且第一次迭代滤波的加权带噪协方差矩阵由多通道初始目标语音频域信号估算的功率谱作为加权值对带噪信号逐个时频点进行加权确定；

根据多通道目标语音频域信号确定目标语音时域信号。

本申请实施例中，采用功率谱对滤波后的信号加权获得加权带噪协方差矩阵，可使协方差矩阵逐渐收敛至噪声协方差矩阵，提升最小功率无失真响应滤波器的滤波性能；采用加权带噪协方差矩阵构成的最小功率无失真响应滤波器对未处理的信号进行迭代滤波，并且在迭代中根据上次迭代获得的信号重新确定加权带噪协方差矩阵，逐步的减小了加权带噪协方差矩阵的估计误差，可提升滤波器的鲁棒性，以减小目标语音的失真。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京声加科技有限公司，未经北京声加科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110267335.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种可云雾抑尘的工矿料棚取料系统
下一篇：一种提高铅酸蓄电池寿命的正极铅膏及其制备方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于传声器阵列的波束形成方法和装置有效

专利文献下载