[发明专利]基于Faster R-CNN的声呐目标检测方法在审
申请号: | 201810229078.9 | 申请日: | 2018-03-20 |
公开(公告)号: | CN108596030A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 孔万增;陈威;于金帅;范巧男;王楼 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;G01S15/89 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 黄前泽 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标检测 目标检测与识别 特征提取 图像 卷积神经网络 低信噪比 水声环境 水下环境 重大创新 次特征 对线 线状 验证 局限 学习 创建 表现 网络 发现 研究 | ||
1.基于Faster R-CNN的声呐目标检测方法,其特征在于该方法包括以下步骤:
步骤(1)、三维成像声呐数据预处理
将三维成像声呐采集到的原始声呐数据解析出声呐图像;
步骤(2)、声呐图像的特征提取
采用区域加速卷积神经网络Faster-RCNN对声呐图像目标进行特征提取:
2.1通过共享卷积神经网络CNN提取声呐特征图;其中步骤(1)预处理得到的声呐图像作为CNN的输入;其中提取声呐特征图的具体过程是:
2.1.1将预处理得到不同尺寸的声呐图像缩放至固定的大小,然后将固定大小的声呐图像送入CNN网络;
2.1.2在CNN网络中,对声呐图像做卷积、池化操作,得到第一层特征图;
2.1.3将上一层得到的声呐特征图反复做卷积、池化操作,得到声呐特征图;
2.2通过区域建议网络RPN代替传统的选择性搜索算法SS提取区域建议(RP);其中上述得到的声呐特征图作为RPN网络的输入;其中提取区域建议的具体过程是:
2.2.1将上述得到的声呐特征图的每一个像素点均设置多种不同尺寸的初始检测框和4个偏移量(包括检测框中心点坐标、边框长、宽);
2.2.2将步骤2.2.1得到的初始检测框送入softmax概率层,每个检测框将得到两个概率得分,通过概率得分判断检测框属于前景还是背景,最终筛选出属于前景的检测框;上述选择概率得分选测标准是:当第i个检测框的概率得分与真实标记的检测框的概率得分的IOU≥0.7时(IOU表示交并比),即判定该检测框为前景;当IOU≤0.3时,则认为该检测框为背景,至于那些在0.3<IOU<0.7的检测框将不参与训练,即被淘汰掉;
2.2.3将步骤2.2.2得到的检测框的得分通过非极大值抑制技术进行排序,选取前n个结果作为真正的区域建议输出;
步骤(3)、声呐图像的目标分类与定位
通过区域兴趣池化层ROI对RPN网络提取的区域建议(RP)进行池化操作,得到全连接层,用于声呐图像分类和检测;
其中声呐图像的目标分类的具体过程是:
3.1将步骤(2)中提取到的声呐特征图和RP送入ROI网络,将不同大小的RP归一化为固定大小,得到统一纬度的特征向量;
3.2将步骤3.1得到的特征向量送入用于分类的全连接层,输出声呐目标的概率,确定声呐目标类别;
3.3将步骤3.1得到的特征向量送入用于计算边框回归的全连接层,输出声呐目标的边框偏移量,修正目标用于定位的边框偏移量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810229078.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序