[发明专利]一种语音波达方向估计方法及装置在审
申请号: | 202011011975.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN111929638A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 谭祚;何云鹏;许兵 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
主分类号: | G01S3/802 | 分类号: | G01S3/802 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 方向 估计 方法 装置 | ||
1.一种语音波达方向估计方法,其特征在于,包括如下步骤:
S1:将麦克风阵列接收的宽带语音信号拆分为多个窄带语音信号;将0-180度空域划分为多个初始空域网格;
S2:计算每一窄带语音信号中每个频点的导向矢量以及协方差矩阵,分离信号子空间与噪声子空间,求解空域网格各网格点的空间谱能量;通过空间谱能量峰值对应的网格点判断估计的波达方向;
S3:通过步骤S2 得到的波达方向,在可能存在目标的网格区间内增加网格点;在增加网格点后的缩小网格上继续重复步骤S2对波达方向进行修正,直至达到网格添加上限。
2.如权利要求1所述语音波达方向估计方法,其特征在于,所述步骤S1中将宽带语音信号拆分为多个窄带语音信号的具体步骤为:将语音信号进行加窗分帧处理,将每帧的时域音频信号转换到频域,并对频域信号的频谱进行分频处理,将宽带语音信号划分为多个窄带语音信号。
3.如权利要求1所述语音波达方向估计方法,其特征在于,所述步骤S2中,对每个窄带,窄带内第个频点的导向矢量表示为:
其中,表示单个初始空域网格的网格点角度,下标1,2…k表示不同网格点,表示第i个频点的频率 ,表示麦克风阵列中两个麦克风之间的距离,为声速,e为自然常数,j表示复数虚部,E为期望值计算符号。
4.如权利要求1所述语音波达方向估计方法,其特征在于,所述步骤S2中频点的协方差矩阵Ryy表示为:
,
其中表示接收音频信号的频域,为阵列流型矩阵,表示噪声方差,为单位矩阵,Ryy表示麦克风阵列接收信号的协方差矩阵,表示语音信号的协方差矩阵,上标H表示共轭转置运算,θ为语音信号的波达方向,f为频点频率,E为期望值计算符号。
5.如权利要求4所述语音波达方向估计方法,其特征在于,所述步骤S2中分离信号子空间与噪声子空间具体为:
将麦克风阵列接收信号协方差矩阵Ryy通过特征值分解方法分解为信号子空间和噪声子空间,表示为:
;
其中表示信号子空间,表示噪声子空间;ΣX、ΣN分别表示信号子空间与噪声子空间的特征值构成的对角矩阵。
6.如权利要求4所述语音波达方向估计方法,其特征在于,所述步骤S2中利用导向矢量和噪声子空间的正交特性估计各网格方向的空间谱能量,各网格方向的空间谱能量P(θ,f)表示为:
其中,的峰值对应的网格点即为估计的波达方向,表示导向矢量,上标H表示共轭转置运算,表示噪声子空间,θ为语音信号的波达方向,f为频点频率。
7.如权利要求1所述语音波达方向估计方法,其特征在于,所述步骤S3中,在已经估计出的波达方向所处网格点两侧对称添加网格点,添加网格点应位于上一次划分的最小网格内。
8.一种语音波达方向估计装置,其特征在于,包括顺序连接的阵列模块、控制模块、输入模块、估计模块、优化模块和输出模块;
所述阵列模块为在水平面上设置的多个麦克风组成的麦克风阵列;
控制模块实现语音波达方向估计算法的工作状态由唤醒词识别控制;
输入模块将语音信号进行处理并转化为不同频率的频点数据;
估计模块选取语音特征明显的频带范围,对该范围内的每个频点数据进行一次波达方向估计;
优化模块通过自适应的增加空域网格点的方法优化算法;
输出模块将估计的语音波达方向传递给语音增强系统,用于后续系统对语音的增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011011975.6/1.html,转载请声明来源钻瓜专利网。