[发明专利]利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法有效
申请号: | 201310473337.X | 申请日: | 2013-10-11 |
公开(公告)号: | CN103474072A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 李应;魏静明 | 申请(专利权)人: | 福州大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/02 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 纹理 特征 随机 森林 快速 鸟鸣 识别 方法 | ||
技术领域
本发明涉及鸟鸣声识别技术领域,特别是一种利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法。
背景技术
生态环境下普遍存在的鸟鸣声中包含着丰富的信息,鸟鸣声识别在了解鸟类行为等特征的同时,还可以对相关环境做一定程度的分析。鸟鸣声识别的一般方法是先从鸟鸣声片段中提取特征,然后结合分类器模型进行识别和分类。
原始鸟鸣声信号经过短时傅里叶变换(Short-Time Fourier Transform,STFT)可以得到其时频谱图,该时频谱图本质上是一副灰度图像,因此可以通过图像特征实现鸟鸣声识别。目前,借助图像特征,鸟鸣声识别领域已取得了一些成果。文献[1]提出一种基于时频谱图有监督的时频分割方法,利用时频单元方差等特征进行鸟鸣声识别。文献[2]提出一种基于时频谱图形状特征的方法,利用角度径向变换特征实现鸟鸣声自动识别。
不同于以上特征,纹理特征是一种全局统计特征,在图像识别中具有较大的优越性。因此,我们试图利用时频谱图纹理特征进行鸟鸣声识别。纹理特征提取方法中,基于统计的灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)因其原理简单、并能较好反映纹理图像而被广泛采用[3-6]。但GLCM的二维表示占用存储空间大,提取二次统计纹理特征的过程计算量大、耗时多。在GLCM的改进算法中,和差统计法(Sum and Difference Histograms,SDH)[7]的一维表示能够有效地克服GLCM的缺点。
同时,为了进行鸟鸣声识别,诸多单分类器模型被采用并取得良好的识别性能,如支持向量机(Support Vector Machine,SVM)[8]、隐马尔科夫模型(Hidden Markov Model,HMM)[9]等。不过它们依然存在一些缺点,如对不同类型数据检测性能不平衡、响应时间较长等。而随机森林(Random Forest,RF)[10]作为一种组合分类器,能有效解决单分类器面临的问题。
此外,真实环境中普遍存在着各种背景噪声,这使得噪声环境下的鸟鸣声识别具有重要的现实意义。文献[11]采用谱减法,功率谱分析及自相关分析进行噪声环境下的鸟鸣声识别。文献[12]利用基于帧线性预测编码(Linear Predictive Coding,LPC)的聚类,提取有效音节实现噪声环境下鸟鸣声识别。但这些方法主要针对特定噪声环境下的鸟鸣声识别,不能普遍适用于真实环境中的非平稳噪声。而短时谱估计[13]能够有效处理非平稳噪声下的音频增强。
发明内容
本发明的目的是提供一种利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法,解决了纹理特征提取过程中灰度共生矩阵(GLCM)占用空间大、耗时,以及识别和分类过程中常见单分类器分类速度慢的问题。
本发明采用以下方案实现:一种利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法,其特征在于:步骤1,通过短时谱估计算法对鸟鸣声带噪功率谱进行音频增强;步骤2,采用和差统计法(SDH)对增强功率谱快速提取纹理特征;步骤3,由随机森林(RF)实现快速分类。
本发明首先通过短时谱估计对鸟鸣声做增强处理,然后由SDH对得到的增强功率谱快速提取纹理特征,再结合RF进行快速识别和分类。实验结果表明,该方法提取的纹理特征具有良好的识别性能,在纹理特征提取与识别和分类两个环节都减少了时耗,同时能够有效提高非平稳噪声环境下鸟鸣声识别性能。
附图说明
图1是本发明利用纹理特征与RF的快速抗噪鸟鸣声识别方法流程示意图。
图2是本发明RF的基本原理框图。
图3a是绣眼波形图。
图3b是秃鹰波形图。
图3c是绣眼声谱图。
图3d是秃鹰声谱图。
图3e是增强后绣眼声谱图。
图3f是增强后秃鹰声谱图。
图4是实验甲在不同噪声环境和不同信噪比下的平均识别率。
图5是实验乙在不同噪声环境和不同信噪比下的平均识别率。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本发明的利用纹理特征与RF的快速抗噪鸟鸣声识别方法可分为前端处理、纹理特征提取以及识别和分类三个环节,如图1所示。从真实环境中采集的原始鸟鸣声信号y(t)可表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310473337.X/2.html,转载请声明来源钻瓜专利网。