[发明专利]声音判定方法和声音判定装置有效
申请号: | 200710196043.1 | 申请日: | 2007-11-30 |
公开(公告)号: | CN101236250A | 公开(公告)日: | 2008-08-06 |
发明(设计)人: | 早川昭二 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G01S11/14 | 分类号: | G01S11/14;G10L21/02 |
代理公司: | 隆天国际知识产权代理有限公司 | 代理人: | 张龙哺 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 判定 方法 装置 | ||
技术领域
本发明涉及声音判定方法和声音判定装置,其根据由多个声音接收器从多个声源接收到的声信号来判定是否存在特定的声信号,尤其涉及用于识别来自距声音接收器最近的声源的声信号的声音判定方法和声音判定装置。
背景技术
随着目前计算机技术的发展,即使对于需要大量操作处理的声信号处理来说,以实际的处理速度来执行处理过程变得可能。由此期望使用多个麦克风的多信道声信号处理功能变得可用。上述应用的一个例子是噪声抑制技术。在噪声抑制技术中,识别来自目标声源例如最近声源的声音,并且通过如下操作,例如利用入射角或根据该入射角判定的到达每一个麦克风的声音到达时间差作为变量的延迟-和波束形成(delay-sum beamforming)方法或零点波束形成(null beamforming)方法,加强来自识别声源的声音,并且通过抑制来自除了识别声源之外的声源的声音,来加强目标声音并抑制其它声音。此外,当作为目标的附近声源移动时,通常利用以入射角作为变量的延迟-和波束形成方法得到能量分布,并且根据能量分布,估计位于具有最大能量的角度处的声源,从而加强来自该角度的声音,并抑制来自不同于该角度的其它角度的声音。
此外,当声音不是连续地从该附近目标声源发出时,通常将所估测的环境噪声的能量与当前能量之间的比率或差值用于检测从该附近目标声源发出声音的时间间隔。
此外,在美国专利No.6,243,322中,揭示了一种方法,其使用通过利用入射角作为变量的延迟-和处理(用于延迟-和波束形成)得到的能量分布的峰值与其它角度处的值之间的比率,来判定入射声音是来自附近目标声源还是来自远距离的声源。
发明内容
然而,在存在噪声例如环境噪声或非稳态噪声的环境下,通过利用入射角作为变量的延迟-和处理(用于延迟-和波束形成)得到的能量分布存在以下问题:出现多个峰或峰变宽,从而变得难以识别附近目标声源。
此外,当来自附近目标声源的声音不是以恒定强度连续发出时,由于环境噪声的缘故,能量分布峰变得不清楚,从而存在这样的问题,即检测来自该目标声源的声音被发出的时间间隔变得更加困难。
此外,在美国专利No.6,243,322所揭示的方法中,使用所有频带,包括具有差S/N比的频带,因此在喧哗的环境中,存在以下问题,即来自附近声源的声音所在角度的峰变得不清楚,从而难以精确地判定来自该附近声源的声音。
考虑到上述问题,本发明的主要目的是提供:一种声音判定方法和一种声音判定装置,其中该方法通过计算由多个麦克风接收的声信号的相位差谱,即使在喧哗的环境中也能够容易识别来自目标声源的声音的出现间隔,并且在所计算出的相位差等于或小于特定阈值时,判定包括来自作为识别目标的最近声源的声信号;该声音判定装置用于实施该声音判定方法。
此外,本发明的另一个目的是提供一种声音判定方法和其装置,其在S/N比等于或小于预定阈值时,通过判定不包括来自目标声源的声信号,提高了识别来自目标声源的声音出现间隔的精确性。
此外,本发明的另一个目的是提供一种声音判定方法和其装置,其通过根据诸如S/N比、环境噪声、滤波器特性、声音特性等因素将用于判定的频率分类,改善了判定来自目标声源的声音出现间隔的精确性。
本发明第一方案的声音判定方法是使用声音判定装置的声音判定方法,其根据由多个声音接收装置从多个声源接收到的模拟声信号,来判定是否存在指定声信号,其中该声音判定装置将由各个声音接收装置接收到的各个声信号转换成数字信号;将被转换成数字信号的各个声信号转换成频率轴上的信号;计算被转换成频率轴上的信号的各个声信号之间在每一个频率处的相位差;当所计算的相位差等于或小于预定阈值时,判定包括由所述声音接收装置从最近声源接收到的声信号;并根据该判定结果执行输出。
本发明第二方案的声音判定装置是这样一种声音判定装置,其根据由多个声音接收装置从多个声源接收的模拟声信号,来判定是否存在特定的声信号,并包括:用于将由所述各个声音接收装置接收到的各个声信号转换成数字信号的装置;用于将被转换成数字信号的各个声信号转换成频率轴上的信号的装置;用于计算相位差的装置,该相位差为被转换成频率轴上的信号的各个声信号之间在每一个频率处的相位分量的差值;在所计算出的相位差等于或小于预定阈值时,用于判定包括指定目标声信号的判定装置;以及用于根据该判定结果执行输出的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710196043.1/2.html,转载请声明来源钻瓜专利网。