[发明专利]一种基于卷积神经网络的海洋哺乳动物发声实时识别方法有效

专利信息
申请号: 202111456006.6 申请日: 2021-12-02
公开(公告)号: CN113870870B 公开(公告)日: 2022-04-05
发明(设计)人: 吕连港;段德鑫;姜莹;刘宗伟;杨春梅 申请(专利权)人: 自然资源部第一海洋研究所
主分类号: G10L17/26 分类号: G10L17/26;G10L17/18;G10L17/04;G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 沈小明
地址: 266061 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 海洋 哺乳动物 发声 实时 识别 方法
【权利要求书】:

1.一种基于卷积神经网络的海洋哺乳动物发声实时识别方法,其特征在于所述方法具体步骤如下:

1)信号处理,将一段水下声音信号标准化处理,然后分成均等长度N段,采用快速傅里叶变化进行时频处理得到每段数据的时频图,存为三通道(RGB)彩色时频图像;

2)信号标注,检查每一张三通道彩色时频图像,使用矩形框将出现的海洋哺乳动物叫声信号的轮廓包围住,并标注物种类别,通过程序自动获得矩形框的中心坐标及宽高,将这部分标注信息写入标注文件;

3)识别模型的设计,识别模型使用卷积神经网络,卷积神经网络的输入为三通道彩色时频图像矩阵,卷积神经网络的输出为一个识别矩阵;

4)识别模型训练,将三通道彩色时频图像与标注文件输入卷积神经网络进行训练,根据损失函数计算网络输出与标注信号的损失,在训练过程中不断优化此损失,在达到预定轮次后结束训练,训练完成后得到识别模型;

卷积神经网络输出与真实标注信号的损失由函数计算:

其中xi,yi,wi,hi分别为神经网络输出的检测框的中心横坐标,中心纵坐标,检测框的宽,检测框的高;分别为标注图像中真实信号标注框的中心横坐标,中心纵坐标,标注框的宽,标注框的高;Ci是该检测框是否包含信号的置信度,是标注图像中对应检测框是否包含信号的置信度,若有信号为1,无信号为0;pi为模型预测的信号所属物种的分类标签;为标注图像中对应的物种真实分类标签;

5)将待检测的数据经过与步骤1)相同的处理得到彩色时频图像,随后将待检测数据的时频图像输入步骤4)训练好的模型,模型经过计算输出一个输出矩阵,对输出矩阵的信息进行转换与筛选,得到若干组包含中心坐标、长宽、置信度与分类标签的识别结果,中心坐标与长宽构成的矩形框代表了模型检测到的信号,置信度与分类标签则给出了物种分类。

2.根据权利要求1所述的方法,其特征在于所述步骤3)中的识别模型使用的卷积神经网络为24层卷积层、2层池化层与2层全连接层。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于自然资源部第一海洋研究所,未经自然资源部第一海洋研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111456006.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top