[发明专利]一种鸟鸣声智能识别方法、装置、设备和介质有效
申请号: | 202110090995.5 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112908344B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 张承云;凌嘉乐;陈庆春;肖波;吴科毅;余上 | 申请(专利权)人: | 广州大学;广州灵感生态科技有限公司 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/04;G10L17/02 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 常柯阳 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 鸟鸣 智能 识别 方法 装置 设备 介质 | ||
1.一种鸟鸣声智能识别方法,其特征在于,包括:
获取原始鸟鸣声信号;
采用最大后验估计器对所述原始鸟鸣声信号进行降噪处理,得到目标鸟鸣声信号;
从所述目标鸟鸣声信号中提取目标特征;
根据所述目标特征训练得到目标分类模型;
通过所述目标分类模型对待识别鸟鸣声进行识别,确定所述待识别鸟鸣声的识别结果;
所述根据所述目标特征训练得到目标分类模型,包括:
获取所述目标特征中包含的MFCC参数作为分类模型的输入数据,并根据所述输入数据进行训练;所述分类模型采用DenseNet和BLSTM结合的网络结构;
采用交叉熵函数作为所述分类模型的损失函数,将所述分类模型训练得到目标分类模型;
其中,所述DenseNet包括密集块和过渡层;
所述密集块中的非线性组合函数包括批归一化结构、激活函数结构和3×3的卷积结构;
所述DenseNet还包括1×1的卷积操作;
所述过渡层包括两个相邻的密集块;
所述BLSTM包括前向的长短时记忆网络和后向的长短时记忆网络。
2.根据权利要求1所述的一种鸟鸣声智能识别方法,其特征在于,所述采用最大后验估计器对所述原始鸟鸣声信号进行降噪处理,得到目标鸟鸣声信号这一步骤之前,还包括:
将所述原始鸟鸣声信号中幅度最大的点放大到设定阈值;
记录放大过程中幅度最大的点的放大比例;
根据所述放大比例,将所述原始鸟鸣声信号中所有点进行放大处理。
3.根据权利要求1所述的一种鸟鸣声智能识别方法,其特征在于,所述采用最大后验估计器对所述原始鸟鸣声信号进行降噪处理,得到目标鸟鸣声信号,包括:
计算所述原始鸟鸣声信号的先验信噪比,确定所述原始鸟鸣声信号中的鸟鸣声帧和噪声帧;
通过最大后验估计器对所述噪声帧进行降噪处理,得到已降噪的目标鸟鸣声文件和每一帧鸟鸣声存在概率的文件。
4.根据权利要求3所述的一种鸟鸣声智能识别方法,其特征在于,所述采用最大后验估计器对所述原始鸟鸣声信号进行降噪处理,得到目标鸟鸣声信号这一步骤之后,还包括:
对所述目标鸟鸣声信号进行分割处理,去除所述目标鸟鸣声信号中的静音段;
根据所述每一帧鸟鸣声存在概率的文件,将所述目标鸟鸣声进行分段处理,得到数据维度一致的多个鸟鸣声片段。
5.根据权利要求1所述的一种鸟鸣声智能识别方法,其特征在于,从所述目标鸟鸣声信号中提取目标特征,包括:
通过一阶高通滤波器对所述目标鸟鸣声信号进行预加重处理,得到第一鸟鸣声信号;
按照预设的帧长,对所述第一鸟鸣声信号进行分帧处理,得到第二鸟鸣声信号;
对所述第二鸟鸣声信号进行加窗处理,得到第三鸟鸣声信号;
对所述第三鸟鸣声信号进行快速傅里叶变换处理,得到第四鸟鸣声信号;
通过梅尔滤波器组对所述第四鸟鸣声信号进行平滑化处理,得到第五鸟鸣声信号;
对所述第五鸟鸣声信号进行对数运算,得到对数能量;
对所述对数能量进行离散余弦变换,得到MFCC参数;
根据所述MFCC参数,对所述第五鸟鸣声信号进行差分变换,得到目标特征。
6.根据权利要求1所述的一种鸟鸣声智能识别方法,其特征在于,通过所述目标分类模型对待识别鸟鸣声进行识别,确定所述待识别鸟鸣声的识别结果,包括:
通过所述目标分类模型对待识别鸟鸣声进行识别,得到初始识别结果;通过基于贝叶斯决策的数据融合规则,对所述初始识别结果进行归类验证,确定所述待识别鸟鸣声的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学;广州灵感生态科技有限公司,未经广州大学;广州灵感生态科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110090995.5/1.html,转载请声明来源钻瓜专利网。