[发明专利]一种基于麦克风阵列的声目标分类方法有效
申请号: | 201510151851.0 | 申请日: | 2015-04-01 |
公开(公告)号: | CN104766093B | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 郭峰;黄景昌;祖兴水;程勇博;刘华巍;李宝清;袁晓兵 | 申请(专利权)人: | 中国科学院上海微系统与信息技术研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01S3/14 |
代理公司: | 上海智信专利代理有限公司31002 | 代理人: | 潘振甦 |
地址: | 200050 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 麦克风 阵列 目标 分类 方法 | ||
技术领域
本发明涉及一种基于麦克风阵列的声目标分类方法,特别是涉及一种采用麦克风阵列将声目标的声音信号特征和声目标的空间特征相结合的分类方法。属于声目标识别分类技术领域。
背景技术
利用声音信号来对目标进行分类一直是模式识别领域一个十分重要的课题。相比较单麦克风,麦克风阵列富含更多的信息。利用这些信息可以实现声目标的定位,声信号的增强以及干扰的抑制。在目前的利用麦克风阵列来对声目标进行分类的方法大部分集中于这样的架构:先用波束形成对声音信号进行增强,然后将增强后的信号送入分类器。在这种架构下,用于波束形成的方法的主要有最小方差无畸变响应(Minimum variance distortionless response,MVDR)和延时-求和(Delay and Sum)等。
MVDR虽然能够较好的抑制来自其它方向上的干扰,但是一方面由于有矩阵求逆操作,计算量相对较大,另一方面经过MVDR处理后的信号,其分类效果有时候会反而不如延时-求和算法。延时-求和主要是利用目标声信号在各个通道存在不同延时的特点,通过算法估计出各个通道的延时,然后将各个通道按各自的延时在时间上进行移位,最后将移位后的各个通道信号叠加相加,从而对目标声信号进行增强。但由于移位的长度等于延时除以采样周期,这种算法受采样率制约,需要较高的采样率。与延时-求和方法是通过时间上的移位来弥补各个通道之间声信号的时间差从而受限于采样率这一特点相比,本发明针对这种信号增强后接分类器的分类算法架构,在波束形成的信号增强端采用常规波速形成(CBF)的方法,通过调整各通道的相位来弥补通道间的时间差。
此外,当利用麦克风阵列对声目标进行分类的时候。现有的分类器利用目标的空间特征鲜有报道。然而目标角度变化量Δθ本身则是一个十分重要的空间特征,富含大量的信息,例如当分类目标为运动车辆的时候,如果相邻两段声音信号时间间隔较短(比如125ms),车辆离麦克风阵列较远时,Δθ趋于0,当车辆离麦克风阵列较近时,Δθ变大,但其值仍然在一个较小的区间中,且满足一定的函数关系。而噪声信号的角度变化量Δθ的特点是,即使相邻两段声音信号的时间间隔较短,定向角度θ随时间的变化常常出现波动甚至震荡现象,即Δθ取值很大且不满足运动车辆的Δθ所满足的函数关系。这是噪声信号与运动车辆的信号一个差异十分显著的特征。所以将目标角度变化量Δθ作为一个空间特征用于分类器可以提高声目标和噪声间的分类准确率。本发明拟首先通过常规波束形成对各通道声音信号进行加权求和,以通过调整各个通道的信号相位来弥补其到达时间差,然后再提取经常规波束形成后的信号的特征,将其再加上定向角度变化量的空间特征一起作为新的特征,可望有效提高分类器的分类准确率及抗噪能力。从而构筑成本发明的构思。
发明内容
本发明的目的在于提供一种基于麦克风阵列的声目标分类方法,也就是说本发明所要解决的技术问题是提供一种基于麦克风阵列的,环境适应能力强、性能可靠,具有较强抗噪能力的声目标分类方法。
本发明所提供的一种采用麦克风阵列的结合目标空间特征的声目标分类方法,具体包括以下步骤:
(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;
(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类。
所述的麦克风阵列的麦克风数量为2个或2个以上,排列方式为均匀排列或随机排列。
所述步骤(1)中的定向算法为现有的声阵列定向算法之一。可选用的算法有很多,现有的能定向的算法均可选用,包括多重信号分类算法(MUSIC)、旋转不变子空间法(ESPRIT)以及最大似然算法等。
所述步骤(1)中的波束形成方法为常规波束形成(参见王永良“空间谱估计理论与算法”P59,清华大学出版社),这实际上也是一个基本的算法,具体算法如下:
其中,c为一个调节信号幅度的常数,M为麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,AH表示流型矩阵A的共轭转置,X为麦克风阵列采集信号的矩阵形式表达,j表示虚数单位,ω0为进行常规波束形成所选取的参考频点,τi表示声音信号在第i个阵元处的时移,常规波束形成的方向为定向算法所得出的目标方向。
所述步骤(2)中的定向角度变化量等于当前信号的定向角度减去其前一段信号的定向角度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海微系统与信息技术研究所,未经中国科学院上海微系统与信息技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510151851.0/2.html,转载请声明来源钻瓜专利网。