[发明专利]一种基于改进FasterR-CNN的海底生物目标检测方法在审
申请号: | 202011213028.5 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112257810A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 马艳华;刘宇昊;朱明;常玉春;岳庭秀 | 申请(专利权)人: | 大连理工大学人工智能大连研究院;大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪 |
地址: | 116000 辽宁省大连*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 fasterr cnn 海底 生物 目标 检测 方法 | ||
本发明属于水下目标检测领域,提供了一种基于改进FasterR‑CNN的海底生物目标检测方法,通过样本复制和随机擦除实现数据增广,进一步通过加强特征提取网络backbone改进Faster R‑CNN对包含海底小目标图像的特征提取能力,从而提高训练样本不足情况下,海底生物目标的识别准确率。通过本发明设计的基于改进Faster R‑CNN的海底生物目标检测方法,可以解决海底生物目标检测中训练数据不足和对小目标检测效果不佳的问题,大大提高了识别准确率。本发明,有助于目标检测算法在水下机器人上的应用,进一步为水下机器人海生物自主捕捞技术提供技术支撑。
技术领域
本发明属于水下目标检测领域,为一种基于改进FasterR-CNN的海底生物图像特征提取与目标识别,具体为一种基于改进FasterR-CNN的海底生物目标检测方法。
背景技术
近年来,我国逐渐重视对海洋资源的开发和利用。同时,水下机器人自主作业技术对于海底环境勘探和海洋生物捕捞等工作的支持也变得愈加重要。人工智能算法设计随着数据量和存储访问量的快速增长获得了极大发展,已经在语音识别、计算机视觉和自然语言处理等领域的应用取得了突破性的进展。海底生物的目标检测作为计算机视觉任务的一种,同时也作为水下机器人自主作业的重要组成部分,应用深度学习技术取代传统鲁棒性差,准确率低的目标检测算法来实现更高的速度和性能成为应用研究的热点。
目前,基于深度学习的目标检测模型通常由两部分组成,其一是backbone(网络主干),用于提取特征图,如VGG、ResNet、ResNetXt和DenseNet等耳熟能详的backbone都是GPU平台上常用的特征提取网络;其二是head(网络头部),用于根据特征图做边界回归和目标分类,包括YOLO、SSD等单阶段检测架构,和Fast R-CNN、Faster R-CNN等基于区域回归的双阶段检测架构。然而尽管通用的检测识别技术已经比较成熟,但在海底生物目标检测识别的研究和应用存在着以下问题:(1)海底生物目标检测数据集训练数据样本不足,海底环境复杂且多变,因而导致获取有效的海底生物目标图片较为困难,并且涉及到大量图片标注工作。此外,目前国内外尚没有公开可用的标准数据集;(2)海底生物,如海参、海胆及扇贝等,体积较小,数量十分丰富且容易堆叠,这类小目标对象的目标分类和边框回归更为困难。因此,针对上述问题,设计一种高识别率的海底生物目标检测方法具有重要的意义。
发明内容
针对海底生物目标检测识别任务中数据集训练数据样本不足和对小目标检测效果不佳这两个问题,提出一种基于改进Faster R-CNN的海底生物目标检测方法,通过样本复制和随机擦除实现数据增广,进一步通过加强特征提取网络backbone改进Faster R-CNN对包含海底小目标图像的特征提取能力,从而提高训练样本不足情况下,海底生物目标的识别准确率。
本发明的技术方案:
一种基于改进FasterR-CNN的海底生物目标检测方法,步骤如下:
步骤1:获取海底生物图像数据样本,构建样本数据集,随机选择样本数据集中70%的图像数据构成训练数据集,30%构成测试数据集;
步骤2:在训练数据集上实施基于样本复制的数据增广方法;
步骤2.1:在整个训练数据集中挑选出类别样本体积小、数量少且边缘清晰的图片,作为做样本复制的目标集合;
步骤2.2:利用Facebook开源的可视化工具Visdom,在目标集合的图片上绘制出用于监督训练的真实边界框(gt_bbox)和类别标签(label),确定出模糊的水下环境中物体的具体位置和类别;
步骤2.3:使用网页工具VGG Image Annotator(VIA),对目标集合的图片中需要扩增数量的类别样本,根据确定的具体位置和类别做轮廓标注,获得.json格式的物理轮廓标注文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学人工智能大连研究院;大连理工大学,未经大连理工大学人工智能大连研究院;大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011213028.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢桥防水防腐涂料
- 下一篇:队列式多主设备RS485总线通讯系统和方法