[发明专利]一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法在审
申请号: | 201510990289.0 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105575403A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 张毅;徐晓东;萧红;罗久飞;黄超;苏祖强 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L19/008;G10L21/028;H04S1/00;H04S7/00 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 听觉 掩蔽 信号 互相 声源 定位 方法 | ||
技术领域
本发明属于双耳信号的声源定位领域,具体涉及声源定位系统中的抗噪和双耳互 相关声源定位方法的改进。
背景技术
在现实生活中,人们的谈话场景通常存在多个声源、背景噪声以及回响,但是人耳 听觉系统能够有效的识别和定位出感兴趣的声源信号,这种现象被称为“鸡尾酒会效应”。 这种现象经常出现在鸡尾酒会上,两个客人可以在说话的一群人的旁边正常的交流,听者 还可以根据感兴趣的语音信号判断出目标声源的方向,比如说听者在听到有人叫唤他的名 字时会将头面向说话者。由此可以看出,人耳听觉系统可以从嘈杂的多声源环境中定位出 目标声源的方向。
“鸡尾酒会效应”展示了人耳听觉系统强大的语音分离和定位功能,带动了研究人 员对于多声源环境下声源定位技术的研究兴趣。随着听觉生理学、人工智能和语音识别技 术的发展,声源定位技术越来越受到重视,很多国家为此投入更多的人力和物力来推动这 一项研究。多声源环境下的声源定位技术不仅在基于语音的人-机交互以及助听器方面有 着广泛的应用,而且还加深人类对人耳听觉中枢系统的研究。本课题主要研究多声源下声 源定位技术,符合人类听觉特性,也使得其有更多实际的应用方向。
近年来,声源定位技术的研究价值得到科研人员的高度重视。这是因为与别的定 位技术仔细相比,一些很好的优点也能在声源定位技术找到[1]。其一,声源定位技术在现 实中受条件的限制比较少,实用性自然好。众所周知,声音是通过空气传播的,其传播过程 并不受光线、温度以及障碍等因素的影响,所以在一些恶劣环境下,声源定位系统仍能正常 工作。其二,声源定位技术在躲避侦查中隐蔽性很高,外界是无法侦测到声源定位系统的活 动迹象,自然就能够保证声源定位系统位置的隐蔽性。其三,声源定位技术相对其他定位技 术而言,其实现比较简单。因为声源定位技术采用的设备比激光、电磁波定位等技术更加简 单便宜,实现也比较容易,因此声源定位技术的投资更加经济实惠,将更适合于推向民用。
另外,声源定位技术在日常生活和生产当中起到非常重要的作用。例如,在智能机 器人研究中,研究人员希望智能机器人能够模拟人耳听觉系统,通过声源定位获取声源的 方向信息,将有助于智能机器人对声源的实时跟踪,提高智能机器人的人-机交互和语音识 别能力;在语音增强的研究当中,为了抑制噪声干扰,利用声源定位技术得到声源的位置信 息,然后调整麦克风面向声源位置,从而就可以增强声源的声音强度;在助听器的研究中, 传统助听器引入声源定位技术,将进一步帮助听觉障碍者恢复正常的听觉能力;在电视电 话会议中,为了让说话人的画面更加清晰,声源定位技术可以获取说话人的位置信息,并且 利用说话人的位置信息引导摄像头转向说话人;在军事领域中,具有代表性的海军舰船和 潜艇的声呐系统都采用了声源定位系统,主要是用来监视海水下面运动的物体,获得目标 物体的位置、航向、航速等信息,然后对其进行声源定位与跟踪;在安防系统的应用中,最常 用的是视频监控,而人们生活所用到的视频监控系统一般都有不足的方面,可是声源定位 技术能够很大程度上解决这些问题,比如说在光线不足的环境下,摄像头无法监控到周围 的所有地方的目标,而声源定位系统能够监控所有地方,只要发现可疑的声音就可以马上 通知监控人员。
综上所述,声源定位技术起源于人们对于人耳听觉特性的研究,因此它通过模拟 人耳听觉系统实现对声源方向的定位功能,在人工智能、语音识别以及助听器方面有着重 要的研究意义和实用价值。
发明内容
本发明所要解决的技术问题是,在鲁棒性方面,针对传统基于双耳互相关的声源 定位方法在噪声环境下声源定位精度下降,提出把听觉掩蔽的听觉特性引入谱减法中,能 够较好地抑制音乐噪声,可以把基于听觉掩蔽的谱减法作为双耳定位的前端处理,这将有 利于广义互相关提取双耳时间差,从而提高声源定位系统在噪声环境下的声源定位精度; 在双耳互相关声源定位方法的改进上,针对“耳廓效应”和“优先效应”对声源定位的影响较 大,提出基于双耳信号帧的互相关声源定位方法,该方法可以减少“耳廓效应”和“优先效 应”所带来的定位误差,从而提高声源定位精度。提出了一种提高声源定位系统在噪声环境 下的声源定位精度的融合听觉掩蔽与双耳信号帧的互相关声源定位方法。。本发明的技术 方案如下:一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510990289.0/2.html,转载请声明来源钻瓜专利网。