[发明专利]一种基于卷积神经网络的海洋哺乳动物发声实时识别方法有效
申请号: | 202111456006.6 | 申请日: | 2021-12-02 |
公开(公告)号: | CN113870870B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 吕连港;段德鑫;姜莹;刘宗伟;杨春梅 | 申请(专利权)人: | 自然资源部第一海洋研究所 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/18;G10L17/04;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科家知识产权代理事务所(普通合伙) 11427 | 代理人: | 沈小明 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 海洋 哺乳动物 发声 实时 识别 方法 | ||
1.一种基于卷积神经网络的海洋哺乳动物发声实时识别方法,其特征在于所述方法具体步骤如下:
1)信号处理,将一段水下声音信号标准化处理,然后分成均等长度N段,采用快速傅里叶变化进行时频处理得到每段数据的时频图,存为三通道(RGB)彩色时频图像;
2)信号标注,检查每一张三通道彩色时频图像,使用矩形框将出现的海洋哺乳动物叫声信号的轮廓包围住,并标注物种类别,通过程序自动获得矩形框的中心坐标及宽高,将这部分标注信息写入标注文件;
3)识别模型的设计,识别模型使用卷积神经网络,卷积神经网络的输入为三通道彩色时频图像矩阵,卷积神经网络的输出为一个识别矩阵;
4)识别模型训练,将三通道彩色时频图像与标注文件输入卷积神经网络进行训练,根据损失函数计算网络输出与标注信号的损失,在训练过程中不断优化此损失,在达到预定轮次后结束训练,训练完成后得到识别模型;
卷积神经网络输出与真实标注信号的损失由函数计算:
其中xi,yi,wi,hi分别为神经网络输出的检测框的中心横坐标,中心纵坐标,检测框的宽,检测框的高;分别为标注图像中真实信号标注框的中心横坐标,中心纵坐标,标注框的宽,标注框的高;Ci是该检测框是否包含信号的置信度,是标注图像中对应检测框是否包含信号的置信度,若有信号为1,无信号为0;pi为模型预测的信号所属物种的分类标签;为标注图像中对应的物种真实分类标签;
5)将待检测的数据经过与步骤1)相同的处理得到彩色时频图像,随后将待检测数据的时频图像输入步骤4)训练好的模型,模型经过计算输出一个输出矩阵,对输出矩阵的信息进行转换与筛选,得到若干组包含中心坐标、长宽、置信度与分类标签的识别结果,中心坐标与长宽构成的矩形框代表了模型检测到的信号,置信度与分类标签则给出了物种分类。
2.根据权利要求1所述的方法,其特征在于所述步骤3)中的识别模型使用的卷积神经网络为24层卷积层、2层池化层与2层全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于自然资源部第一海洋研究所,未经自然资源部第一海洋研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111456006.6/1.html,转载请声明来源钻瓜专利网。