[发明专利]一种声源定位方法及系统有效
申请号: | 201910312565.6 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110007276B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 黄丽霞;张雪英;王杰;李凤莲;陈桂军 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G01S5/20 | 分类号: | G01S5/20 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 程华 |
地址: | 030000 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声源 定位 方法 系统 | ||
本发明公开了一种声源定位方法及系统。本发明的声源定位方法首先对四元麦克风阵列获得的声源语音信号加窗分帧,然后检测出信号有效帧信号,并对筛选出的有效帧信号计算融合二次相关的广义谱减修正相位变换函数。为进一步提高时延精度,采用融合二次相关的平均广义谱减修正相位变换函数计算时延值。最后根据麦克风阵列的几何位置与计算出的时延值进行声源方向估计,提高了声源定位的精度。
技术领域
本发明涉及声源定位领域,特别涉及一种声源定位方法及系统。
背景技术
声源定位已经成为语音信号处理领域的一个研究热点,在视频会议、智能机器人以及智能视频监控系统等领域有广泛的应用。而传统的定位算法在低信噪比、高混响时间的恶劣环境下,定位准确率急剧下降。
发明内容
本发明的目的是提供一种声源定位方法及系统,以提高声源定位的准确率。
为实现上述目的,本发明提供了如下方案:
本发明提供一种声源定位方法,所述声源定位方法包括如下步骤:
采用四元麦克风阵列采集得到四路声源语音信号;所述四元麦克风阵列包括四个麦克风,每个麦克风采集一路声源语音信号;
对四路所述声源语音信号进行同步分帧处理,得到帧信号集合,所述信号帧集合中的每个帧信号包括四路帧信号,分别为第一路帧信号、第二路帧信号、第三路帧信号和第四路帧信号;
判断所述帧信号集合中每个帧信号的有效性,得到有效帧信号子集;
根据所述有效帧信号子集,获取任意两路有效帧信号融合二次相关的平均广义谱减修正相位变换函数;
获取任意两路有效帧信号融合二次相关的平均广义谱减修正相位变换函数的最大峰值所对应的时间点,得到任意两路麦克风声源信号的时延值;
根据所述四元麦克风阵列的几何位置和任意两路麦克风声源信号的时延值,确定声源的方向位置。
可选的,所述对四路所述声源语音信号进行同步分帧处理,得到帧信号集合,具体包括:
采用窗函数对四路所述声源语音信号进行同步加窗分帧处理,得到帧信号xij(n),n表示第n个采样点,n=1,2,...,N,N表示帧长,xij(n)表示第i个帧信号的第j路的信号,j=1,2,3,4;
将所有的帧信号合成为帧信号集合。
可选的,所述判断所述帧信号集合中每个帧信号的有效性,得到有效帧信号子集,具体包括:
利用公式计算第i个帧信号的第j路帧信号的短时帧能量;其中,Eij表示第i个帧信号的第j路帧信号的短时帧能量,n表示第n个采样点,n=1,2,...,N,N表示帧长;
判断第i个帧信号的第j路帧信号的短时帧能量是否大于第一预设阈值,得到第一判断结果;
若所述第一判断结果表示所述短时帧能量不大于所述第一预设阈值,则将i的值增加1,返回步骤“利用公式计算第i个帧信号的第j路帧信号的短时帧能量”;
若所述第一判断结果表示所述短时阵能量大于所述第一预设阈值,则将第i个帧信号设置为起始点,将i的值增加1;
利用公式计算第i个帧信号的第j路帧信号的过零率;其中,
判断所述过零率是否大于第二预设阈值,得到第二判断结果;
若所述第二判断结果表示所述过零率大于所述第二预设阈值,则将第i个帧信号的第j路帧信号的标记Tij设置为1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910312565.6/2.html,转载请声明来源钻瓜专利网。