[发明专利]一种基于改进FasterR-CNN的海底生物目标检测方法在审
申请号: | 202011213028.5 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112257810A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 马艳华;刘宇昊;朱明;常玉春;岳庭秀 | 申请(专利权)人: | 大连理工大学人工智能大连研究院;大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪 |
地址: | 116000 辽宁省大连*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 fasterr cnn 海底 生物 目标 检测 方法 | ||
1.一种基于改进FasterR-CNN的海底生物目标检测方法,其特征在于,步骤如下:
步骤1:获取海底生物图像数据样本,构建样本数据集,随机选择样本数据集中70%的图像数据构成训练数据集,30%构成测试数据集;
步骤2:在训练数据集上实施基于样本复制的数据增广方法;
步骤2.1:在训练数据集中挑选出类别样本体积小、数量少且边缘清晰的图片,作为做样本复制的目标集合;
步骤2.2:利用Facebook开源的可视化工具Visdom,在目标集合的图片上绘制出用于监督训练的真实边界框和类别标签,确定出模糊的水下环境中物体的具体位置和类别;
步骤2.3:使用网页工具VGG Image Annotator,对目标集合的图片中需要扩增数量的类别样本,根据确定的具体位置和类别做轮廓标注,获得.json格式的物理轮廓标注文本;
步骤2.4:在训练过程中每读入一张图片,遍历轮廓标注文本中获得的标注名称,当存在名称与当前读入图片名匹配时,则从文本中取出该图片的轮廓标注;将当前图片该轮廓内的所有像素值复制到一个相同形状的随机区域,完成样本复制;
步骤2.5:使用OpenCV提供的函数求目标轮廓的最小外接四边形的面积S,然后求此面积值S与当前图片内所有用于监督训练的边界框的面积的交并比IoU,与S拥有最大IoU的边界框即视为被复制目标的边界框;
步骤2.6:将步骤2.5中筛选出的边界框赋给步骤2.4中随机复制的样本,同时添加类别标签,用来进行监督训练;
步骤3:在经过样本复制的训练数据集上随机实施基于随机擦除的数据增广方法;
步骤3.1:根据边界框信息判断图像内多个待检测小目标的具体位置,在其周围以随机的概率,放置一个随机大小的矩形来遮挡物体边缘,模拟水下环境中频繁出现的物体堆叠和遮挡情况;
步骤3.2:为了避免随机更改像素值而引起了训练集与测试集数据分布的差异,矩形内的像素值全部赋值为整个训练集样本的像素均值;
步骤4:面向小样本检测任务对检测网络模型Faster R-CNN中的特征提取网络backbone做基于“上采样+特征拼接+'shortcut'路径”的适应性改进;
步骤4.1:对VGG16获得的具有强语义信息但分辨率低的特征图通过多次基于双线性插值算法的上采样方式逐渐增大分辨率得到特征图;
步骤4.2:将VGG16输出并扩大分辨率后的特征图f1与backbone内具有相同分辨率且富含丰富定位信息的特征图在通道数方向上拼接,获得兼备语义和强定位信息的特征图f2;
步骤4.3:将特征图f2重新进行多次卷积和池化操作提取抽象特征,最终得到特征图f3;
步骤4.4:在改进网络之间增加“shortcut”路径来保证网络收敛和避免训练过慢的现象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学人工智能大连研究院;大连理工大学,未经大连理工大学人工智能大连研究院;大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011213028.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢桥防水防腐涂料
- 下一篇:队列式多主设备RS485总线通讯系统和方法