[发明专利]一种基于双麦克风阵列的定向拾音方法及计算设备有效

申请号：	201810070108.6	申请日：	2018-01-24
公开（公告）号：	CN108269582B	公开（公告）日：	2021-06-01
发明（设计）人：	方博伟;卓鹏鹏;张康;尤嘉华;张伟	申请（专利权）人：	厦门美图之家科技有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L21/0232
代理公司：	北京思睿峰知识产权代理有限公司 11396	代理人：	谢建云;赵爱军
地址：	361008 福建省厦门***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于麦克风阵列定向方法计算设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于双麦克风阵列的定向拾音方法，其中双麦克风阵列包含第一麦克风和第二麦克风，通过第一麦克风获取第一声道的音频数据，通过第二麦克风获取第二声道的音频数据，包括步骤：对获取的第一声道的音频数据和第二声道的音频数据分别进行预处理，得到每个音频帧在第一声道的频谱及对应在第二声道的频谱；计算每个音频帧的入射角；根据每个音频帧的入射角计算该音频帧的目标噪音比；利用每个音频帧的入射角和目标噪音比计算该音频帧的滤波器系数；根据滤波器系数生成各音频帧的滤波后频谱；以及通过对滤波后频谱作逆傅里叶变换，来生成期望拾音范围内的音频数据的时域波形。本发明一并公开了用于执行上述定向拾音方法的计算设备。

技术领域

本发明涉及音频处理技术领域，尤其是一种基于双麦克风阵列的定向拾音方法及计算设备。

背景技术

在拍摄视频或录音时，麦克风阵列所接收到的语音信号是期望信号与非期望的噪音信号叠加的结果。由于录音环境常常伴随着各种不同类型的噪音，有稳态的高斯白噪声，也有非稳态的噪声，如食堂、超市、餐厅等声音场所，环境声音组成比较复杂，导致录音结果往往非常嘈杂，影响听音感受，严重的情况下期望的声音甚至会被噪音掩蔽，无法获取期望的语音内容。

针对音频降噪，单麦降噪的基本思想都是采用谱减法，通过语音活动检测获取噪音段音频数据，进一步估计出噪音频谱，从录音结果中减去估计的噪音谱来得到期望语音成分。考虑到环境的多样性，有的录音设备会内置许多不同环境下的背景噪音样本，计算匹配最相似的噪音样本，来应对不同的录音环境。由于录音环境随机性很大，且相同环境中的录音成分更是千差万别，这种内置噪音样本的降噪方式对稳态噪音有一定效果，但是要采集很多噪音样本，工作量较大，对于非稳态噪音抑制效果很弱。同时单麦并不能定位声源，无法实现定向地增强某一个拾音范围内的声音。

因此，在一些小型通信设备或者录音设备中，常需要利用双麦克风阵列来实现增强期望声音、抑制噪音，其基本思想是依赖声源定位检测结果，通过波束成形来提取期望区域的声源，传统的延时加成(delay and sum)的方法通过估计声源定位结果来纠正两个声道直接的延时，再叠加两个声道数据在一定程度上抵消环境噪音。但是，在混响较大或嘈杂环境的中提取效果并不理想，还是需要借助谱减法达到最终降噪的目的，影响听音感受。

鉴于上述原因，需要一种在嘈杂环境中也能够准确地获取期望的语音内容的定向拾音方案。

发明内容

为此，本发明提供了一种基于双麦克风阵列的定向拾音方法，双麦克风阵列包含第一麦克风和第二麦克风，该方法适于对通过第一麦克风获取的第一声道的音频数据和通过第二麦克风获取的第二声道的音频数据进行处理，该方法适于在计算设备中执行，包括步骤：对获取的第一声道的音频数据和第二声道的音频数据分别进行预处理，得到每个音频帧在第一声道的频谱及对应在第二声道的频谱；根据每个音频帧对应在第一声道和第二声道上的频谱间的延时，计算该音频帧的入射角；根据每个音频帧的入射角计算该音频帧的目标噪音比；利用每个音频帧的入射角和目标噪音比计算该音频帧的滤波器系数；根据滤波器系数生成各音频帧的滤波后频谱；以及通过对滤波后频谱作逆傅里叶变换，来生成期望拾音范围内的音频数据的时域波形。

可选地，在根据本发明的方法中，根据每个音频帧对应在第一声道和第二声道上的频谱间的延时、计算该音频帧的入射角的步骤包括：对于每个音频帧，根据音频帧对应在第一声道和第二声道上的频谱计算音频帧的协方差矩阵；根据协方差矩阵计算音频帧的相角谱；以及从相角谱中取最大值对应的角度作为该音频帧的入射角。

可选地，在根据本发明的方法中，根据每个音频帧的入射角计算该音频帧的目标噪音比的步骤包括：根据双麦克风的间距、采样率和声速计算得到第一参数；根据每个音频帧的入射角及第一参数计算得到音频帧对应的第二参数；以及根据第一参数和每个音频帧的第二参数计算得到每个音频帧的目标信噪比。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司，未经厦门美图之家科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810070108.6/2.html，转载请声明来源钻瓜专利网。

上一篇：回声消除方法及装置
下一篇：一种基于时间延迟直方图的语音分离方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于双麦克风阵列的定向拾音方法及计算设备有效

专利文献下载