[发明专利]一种语音波达方向估计方法及装置在审
申请号: | 202011011975.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN111929638A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 谭祚;何云鹏;许兵 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
主分类号: | G01S3/802 | 分类号: | G01S3/802 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 方向 估计 方法 装置 | ||
一种语音波达方向估计方法,包括如下步骤:S1:将麦克风阵列接收的宽带语音信号拆分为多个窄带语音信号;将空域划分为多个初始空域网格;S2:计算每一窄带语音信号中每个频点的导向矢量以及协方差矩阵,分离信号子空间与噪声子空间,求解各网格方向的空间谱能量;通过空间谱能量峰值对应的网格点判断估计的波达方向;S3:通过步骤S2得到的波达方向,在可能存在目标的网格区间内增加网格点;在增加网格点后的缩小网格上继续重复步骤S2对波达方向进行修正,直至达到网格添加上限。采用本发明所述语音波达方向估计方法,在估计过程中通过自适应的添加网格点;能够提高语音信号波达方向方法的估计精度与分辨力。
技术领域
本发明属于语音智能识别技术领域,涉及语音前端信号处理,具体涉及一种语音波达方向估计方法及装置。
背景技术
波达方向估计算法主要用于估计声源目标与麦克风阵列的角度信息,将估计的角度数据输入语音增强系统可以有效的增强该方向的语音信号,并抑制其他方向的噪声信号。目前,语音信号的波达方向估计算法通常采用的是基于到达时间差的方法来进行估计的。然而,当输入信号信噪比降低,混响严重时。此类算法的性能将显著下降。并且,当目标声源数量增多时,该类方法因不能分辨出正确的目标个数,从而导致性能失效。
现有技术的缺点在于:
1、抗混响能力弱;
2、抗噪声能力弱;
3、估计分辨率较低;
4、估计精度不足。
发明内容
为克服现有技术存在的缺陷,本发明公开了一种语音波达方向估计方法及装置。
本发明所述语音波达方向估计方法,包括如下步骤:
S1:将麦克风阵列接收的宽带语音信号拆分为多个窄带语音信号;将0-180度空域划分为多个初始空域网格;
S2:计算每一窄带语音信号中每个频点的导向矢量以及协方差矩阵,分离信号子空间与噪声子空间,求解空域网格各网格点的空间谱能量;通过空间谱能量峰值对应的网格点判断估计的波达方向;
S3:通过步骤S2 得到的波达方向,在可能存在目标的网格区间内增加网格点;在增加网格点后的缩小网格上继续重复步骤S2对波达方向进行修正,直至达到网格添加上限。
优选的,所述步骤S1中将宽带语音信号拆分为多个窄带语音信号的具体步骤为:将语音信号进行加窗分帧处理,将每帧的时域音频信号转换到频域,并对频域信号的频谱进行分频处理,将宽带语音信号划分为多个窄带语音信号。
优选的,所述步骤S2中,对每个窄带,窄带内第个频点的导向矢量表示为:
其中,表示单个初始空域网格的网格点角度,下标1,2…k表示不同网格点,表示第i个频点的频率,表示麦克风阵列中两个麦克风之间的距离,为声速,e为自然常数,j表示复数虚部。
优选的,所述步骤S2中频点的协方差矩阵Ryy表示为:
,
其中表示接收音频信号的频域,为阵列流型矩阵,表示噪声方差,为单位矩阵,Ryy表示麦阵接收信号的协方差矩阵,表示语音信号的协方差矩阵,上标H表示共轭转置运算,θ为语音信号的波达方向,f为频点频率,E为期望值计算符号。
进一步的,所述步骤S2中分离信号子空间与噪声子空间具体为:
将麦克风阵列接收信号协方差矩阵Ryy通过特征值分解方法分解为信号子空间和噪声子空间,表示为:
;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011011975.6/2.html,转载请声明来源钻瓜专利网。