[发明专利]一种基于声传递函数的声源定位方法有效
申请号: | 201710198420.9 | 申请日: | 2017-03-29 |
公开(公告)号: | CN107219512B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 曲天书;吴玺宏;宋涛 | 申请(专利权)人: | 北京大学 |
主分类号: | G01S7/52 | 分类号: | G01S7/52;G01S15/06 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 传递函数 声源 定位 方法 | ||
本发明公开了一种基于声传递函数的声源定位方法。本方法为:1)为每一声源设置一波段;采用麦克风阵列接收各方位的声源的记录信号;2)对于每个方位的声源,根据该声源到麦克风阵列中各麦克风的传递函数估计所述记录信号中各频点的信噪比,然后将信噪比二值化,生成对应声源的频域二值掩模;3)对于每个方位的声源,根据该声源的频域二值掩模滤除所述记录信号中信噪比小于设定阈值H的频点,然后使用该声源到麦克风阵列中各麦克风的传递函数对记录信号做频域逆滤波;4)计算逆滤波结果的通道间相似性,然后根据通道间相似性的计算结果估计声源位置定位目标声源。本发明提高了定位方法的鲁棒性。
技术领域
本发明属于信号处理技术领域,涉及麦克风阵列和声源定位,具体涉及一种基于声传递函数的声源定位方法。
背景技术
声源定位在许多领域有重要的应用,比如自动语音识别、机器人以及计算听觉场景分析等。对人而言,即使在复杂环境中,听者依然能顺利定位目标声源,其主要利用的定位线索有双耳时间差(Interaural Time Difference,ITD)和双耳强度差(InterauralLevel Difference,ILD)。研究人员将上述定位线索应用于麦克风阵列的声源的定位问题中,提出了许多声源定位方法。
一些定位方法仅利用时间定位线索。这类方法首先估计由声源发出的信号到达各麦克风的时间差,即到达时间差(Time Difference Of Arrival,TDOA),之后将TDOA信息映射到空间位置。TDOA可通过GCC(generalized cross-correlation)、GCC-PHAT(generalized cross-correlation phased transform)、SRP(steered response power)以及SRP-PHAT-(steered response power phased transform)等方法计算得到。TDOA与空间位置的映射关系则由麦克风阵列的位置、形状等因素决定。也有一些研究人员使用时间线索以及强度线索共同定位声源,Raspaud等人建立了通道间时间差和强度差与声源位置之间的参数模型,根据估计得到的时间差和强度差确定目标声源的位置。
传递函数刻画了包含了时间差、强度差等定位线索,因此一些研究人员试图利用传递函数实现声源定位。Keyrouz等人提出了一种基于双麦克风的声源定位方法,其基本思想为当且仅当使用与声源方位对应的传递函数对记录信号做逆滤波时两个通道的逆滤波结果相同,即匹配滤波。该方法首先使用状态空间求逆法(state-space inversionmethod)计算所有可能声源位置的传递函数的逆,逐个使用传递函数的逆对记录信号做滤波操作,计算逆滤波结果的通道间相似性,最终将声源定位至使相关系数最大的传递函数对应的空间位置。由于传递函数的逆的计算量过大且可能存在误差,MacDonal将反卷积过程变换为卷积过程,提出新的基于传递函数的声源定位算法。当只有两个麦克风时,对于每一个候选的声源位置,该方法将每个麦克风的记录信号与另一个麦克风的传递函数卷积,之后计算卷积结果间的相关性,使相关性达到最大的传递函数对应的空间位置即为定位输出结果。当麦克风个数较多时,该方法还需要将麦克风成对分组。
声源定位任务的一个主要挑战是如何在噪声干扰下定位目标声源,即如何提高定位方法的鲁棒性。麦克风阵列接收到的声音信号通常可看作由经传递函数滤波的声源信号与噪声干扰共同组成,即麦克风阵列接收信号的信噪比由声源、噪声以及传递函数共同决定,且传递函数仅与声源位置有关,因此可将传递函数作为信噪比的先验知识引入到声源定位任务中,而现有的基于传递函数的声源定位方法并未考虑到这一点。
发明内容
本发明提出了一种基于声传递函数的声源定位方法,在已知所有可能声源位置到麦克风的传递函数时,该方法可以根据声传递函数获取相应麦克风记录信号信噪比的先验信息并将该先验信息用于声源定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198420.9/2.html,转载请声明来源钻瓜专利网。