[发明专利]一种基于Mel子带参数化特征的鸟鸣自动识别方法在审
申请号: | 201710224881.9 | 申请日: | 2017-04-07 |
公开(公告)号: | CN108694953A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 张赛花;赵兆;许志勇 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L25/21 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参数化特征 子带 自动识别 支持向量机算法 带通滤波器组 高斯混合模型 随时间变化 自回归模型 后处理 对数能量 分类识别 滤波处理 能量序列 鸟鸣信号 声学环境 声学监测 声音事件 生态监测 事件能量 数据分帧 物种分类 重要意义 自动分段 数据帧 建模 拟合 时频 图域 输出 检测 | ||
1.一种基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于步骤如下:
步骤1、对野外实测的鸟声连续监测数据进行预处理;
步骤2、对预处理后的连续监测数据进行自动分段,提取鸟鸣声片段;
步骤3、对步骤2得到的鸟鸣片段提取参数化特征;
步骤4、根据步骤3提取出的特征进行鸟类物种的分类识别。
2.根据权利要求1所述的基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于:步骤1对野外实测的鸟声连续监测数据进行预处理具体包括以下步骤:
步骤1-1、将野外实测的连续鸟声监测数据统一转换为相同的采样率;
步骤1-2、对连续鸟声监测数据进行分帧、加窗及短时傅里叶变换,得到功率谱图,功率谱图表示为如下形式:
SP=[sp(1),sp(2),…,sp(L)];
式中,L表示帧数,第l帧(1≤l≤L)频域向量为:
sp(l)=[|S(0,l)|2,|S(1,l)|2,…,|S(N/2-1,l)|2]T;
其中,上标T表示转置,S(k,l),0≤k≤N/2-1表示在时频点(k,l)处的短时傅里叶变换结果,N为每帧信号进行快速傅里叶变换(Fast Fourier Transform,FFT)的点数,k为频率序号。
3.根据权利要求1所述的基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于:步骤2对连续鸟声监测数据进行自动分段具体包括以下步骤:
步骤2-1、设置频率下限和上限分别为fL和fH;
步骤2-2、利用公式确定每一帧的短时能量;
式中,l为帧序号,k为频率序号,S(k,l)表示在时频点(k,l)处的短时傅里叶变换结果,NL和NH分别表示fL和fH对应的频率点序号,e(l)为第l帧的短时能量;
步骤2-3、利用公式le(l)=log10(e(l))确定每一帧的对数能量;
步骤2-4、帧对数能量分布用含有两个高斯分量的高斯混合模型(Gaussian MixtureModel,GMM)生成,则两个高斯分量分别近似为鸣声事件帧集合以及环境噪声帧集合的概率密度函数,概率密度函数表示为:
式中,对应于第m个高斯分量,μm为均值,为方差。wm表示高斯分量权重系数,0≤wm≤1,且满足
步骤2-5、对于第l帧,如果该帧属于环境噪声帧集合的后验概率大于属于鸣声事件帧集合的后验概率,判决该帧归属环境噪声,环境噪声帧不予处理;如果该帧属于鸣声事件帧集合的后验概率大于属于环境噪声帧集合的后验概率,则判决该帧归属某个鸣声片段,与该帧时间上连续且同样满足上述条件的其他帧也归属为该片段;
鸣声片段集合记为D={AE1,AE2,…,AEK},其中K为片段个数;
步骤2-6、计算步骤2-5得到的各个鸣声片段的对数能量,所用公式为:
最大值记为对于第k个片段,如果ME-EAEk≥20dB,则从鸣声片段集合中剔除这个生态研究价值较小的过弱片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710224881.9/1.html,转载请声明来源钻瓜专利网。