[发明专利]一种基于立体声信号的移动音源定位方法有效
申请号: | 201010514924.5 | 申请日: | 2010-10-20 |
公开(公告)号: | CN101982793A | 公开(公告)日: | 2011-03-02 |
发明(设计)人: | 胡瑞敏;王晓晨;周成;涂卫平;黄勇;董石;刘进峰;王松;王国英;高丽 | 申请(专利权)人: | 武汉大学 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张火春 |
地址: | 430072*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 立体声 信号 移动 音源 定位 方法 | ||
技术领域
本发明属于声学技术领域,特别是涉及一种基于立体声信号的移动音源定位方法。
背景技术
听觉研究表明,在神经中枢对输入声信息进行整合时,对音源定位最重要的依据是两耳之间声音信号的差别,通常用空间线索ITD(耳间时间差)和ILD(耳间声级差)两个概念来描述这种差别。
从音源到达双耳的音源信号由于声波传输路程存在差异,从而产生到达双耳的时间偏移称为ITD(耳间时间差),其提供了有关音源方位角位置信息。此外,诸如人头、躯干和耳廓的衍射、折射及共振效应等使得到达两检测器接收信号强度存在差异,称为ILD(耳间声级差),ILD随着音源位置而系统变化,同样提供了音源方位角位置信息。
ITD和ILD以互补的方式工作,具体来说,对频率小于1.5kHz的低频信号ITD对定位起主要作用,而当频率大于1.5kHz时ILD对定位起主要作用。ILD对高频信号起主要作用是因为高频信号的衰减特性,在声源信号传至双耳的路径中,除了空气的吸收外,人的头部就相当于一个障碍物,高频信号将因此被衰减。当频率低于约1.5kHz时,声波波长大于人的头部宽度,声波将产生所谓的“头部衍射”而沿着头部表面弯曲,从而绕过了这一遮挡物,使得声音信号传到左耳的强度比右耳没有衰减或衰减很小,因此空间线索ILD的定位作用就很不明显了;ITD是基于频率特性而产生两耳信号时间上的差异,由于听觉系统所感知的其实是耳间的相位差IPD(Interaural Phase Differences),所以ITD实际上通过IPD起作用,当信号频率小于1.5kHz时,由于其半波长大于两耳间的距离,所以人耳很容易感知这种相位差并判别其相对关系,而当频率大于1.5kHz时,其波长小于两耳间距,此时将会产生IPD判决模糊,人耳无法辨别信号相位从而导致ITD没有明显定位作用。
基于ITD和ILD音源定位互补特性,目前国际上通常基于ITD和ILD对音源方位进行联合估计,即基于音源位置、ITD和ILD间的相关先验知识,通过联合学习方法以实现音源方位定位,但这种方法只适用于静止音源,对于移动音源,当其以较快速度移动时由于多普勒效应的存在会使音源的接受频率发生变化,而ILD与频率紧密相关,一旦音源频率发声变化,原先的先验知识便不再适用,从而使对音源方位的估计产生偏差。因此目前本领域一个比较重要的问题是:如何针对移动音源设计相应的ITD和ILD联合音源定位修正方法,消除由于多普勒效应所带来的定位偏差问题。
发明内容
考虑到上述现有技术的已知解决方案的缺陷,本发明的目的是提供一种根据立体声信号进行移动音源定位的改进技术。
为实现上述目的,本发明的技术方案为一种基于立体声信号的移动音源定位方法,基于ITD测量和ILD测量实现移动音源定位,所述ITD测量和ILD测量获取方式为,对立体声检测器所生成的两路时域信号进行预处理,分别得到两路频域信号,利用两路频域信号分别计算各个频带的ITD测量和ILD测量;预先在各个已知的音源位置对ITD测量和ILD测量分别进行学习,得到ITD频率对位置矩阵和ILD频率对位置矩阵;在对特定时间步中的移动音源进行音源位置定位时,进行以下步骤,
步骤1,获取某特定时间步的ITD测量和ILD测量;
步骤2,将步骤1所得特定时间步的ITD测量和ITD频率对位置矩阵进行比较,将步骤1所得特定时间步的ILD测量与ILD频率对位置矩阵分别进行比较,从而针对各个频带获得音源位置的概率分布,分别构成ITD概率分布矩阵和ILD概率分布矩阵;
步骤3,将步骤2所得ITD概率分布矩阵和ILD概率分布矩阵进行组合,获得用于在该特定时间步进行音源位置定位的联合概率分布;
步骤4,基于多普勒效应对步骤3所得的联合概率分布进行修正,获得修正结果;
步骤5,应用信息论过程,根据步骤4所得对联合概率分布的修正结果,在该特定时间步提取对于音源位置的最佳估计。
而且,步骤3中,对ITD概率分布矩阵和ILD概率分布进行组合取决于音源位置参数。
而且,步骤4中,对联合概率分布的修正实现方式为,通过音源移动速度计算频率迁移量来修正用于音源定位的联合概率分布。
本发明技术方案使用信息论过程来产生可以与后续测量进行组合的预测,以改善基于时间的移动音源定位,并追踪并跟随移动音源。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的学习步骤设置示意图。
具体实施方式
下面以实施例结合附图对本发明的技术方案作进一步说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010514924.5/2.html,转载请声明来源钻瓜专利网。