[发明专利]一种基于双阶段卷积模型的目标区域检测方法在审
申请号: | 202010092626.5 | 申请日: | 2020-02-14 |
公开(公告)号: | CN111310827A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 张涛;李林蔚 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T3/60;G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 卷积 模型 目标 区域 检测 方法 | ||
本发明公开了一种基于双阶段卷积模型的目标区域检测方法,该方法的具体实现过程如下,获取数据集并清洗,对清洗后的图像预处理,检测模型搭建,训练的时候设置每次运行六张图,训练目标检测网络。首先对基于Mask R‑CNN总体结构进行设计,在Mask R‑CNN上减去了分割的分支,并调整网络的结构只进行检测和分类的运算;然后针对数据对基于Mask R‑CNN算法的第一阶段进行重新设计,为了适应数据正样本较少,训练过程中正负样本不平衡的情况,网络在算法第一阶段候选框生成的大小上也进行针对性调整,算法Roi Align的设计也为第二阶段的分类和检测提供了可靠的特征基础;针对数据设计一种双阶段模型上的分阶段训练方式,分阶段的对模型参数进行训练,大大提高了检测精度。
技术领域
本发明属于计算机视觉技术领域,主要为双阶段卷积模型的目标区域检测方法的改进,尤其涉及一种基于双阶段卷积模型的目标区域检测方法。
背景技术
随着人工智能的发展,计算机视觉的应用同样得到蓬勃的发展。在计算机视觉应用中,图像检测是重要的分支,图像目标检测在人脸识别,无人驾驶,无人零售,智能医疗等领域具有重要意义。图像目标检测是计算机视觉中一个重要的研究方向,随着深度学习的发展,目标检测技术取得了非常大的进步。目标检测对于人类来说并不困难,通过对图片中不同颜色模块的感知很容易定位并分类出其中目标物体,但对于计算机来说,面对的是RGB像素矩阵,很难从图像中直接得到狗和猫这样的抽象概念并定位其位置,再加上有时候多个物体和杂乱的背景混杂在一起,目标检测更加困难。目标检测要解决的核心问题是:1.目标可能出现在图像的任何位置。2.目标有各种不同的大小。3.目标可能有各种不同的形状。为解决以上问题,深度学习目标检测领域出现了两个分支,双阶段和单阶段。双阶段模型中一个阶段提出备选框,一个阶段对备选框进行判断。主要为RCNN系列的网络,RCNN,FasterRCNN,MaskRCNN。单阶段的网络,整个生成备选框的过程是一体化的实现。代表有YOLO系列和SSD(single shot detector)。
发明内容
本发明基于双阶段检测模型Mask R-CNN神经网络提出一种改进的目标检测网络。双阶段模型中第一阶段同单阶段模型一样通过RPN层产生预测框进行算法的分类和回归,第二阶段对第一阶段预测框进行再次调整,以求达到更好的结果。Mask R-CNN是一个分类、检测、分割的双阶段模型。网络在候选框生成的大小上进行了针对性调整;Backbone网络分别在不同深度的残差网络上进行试验与选择;另外算法RoiAlign的设计也为第二阶段目标的分类和检测提供了可靠的特征基础。具体方案如下所述:
数据层:
图像输入后首先进行图像的预处理,图像的预处理主要是对图像的清洗和图像的增强以及resize。图像的增强主要在对比度增强,裁剪,旋转,翻转,仿射变换方面对算法性能有更好的提升。并且通过实验发现,许多小剂量的图像增强对算法性能的提升更加显著。在coco数据集中我把旋转的角度设置为随机负5到正5度之间,翻转设置为图像随机左右10%,较小程度的随机改变亮度以及对比度。最后将图片resize到一定尺寸,在coco数据集上resize到800*800*3。
总体网络结构的设计:
MaskR-CNN是一个双阶段检测模型。第一个阶段生成proposals,第二阶段分类并生成边界框和掩码。网络拥有三个分支:分类分支、回归分支、分割分支。2017coco数据集的标注是一个检测的标注格式,无法做分割,这里直接减去分割模块以及分割损失函数。修改后的网络结构如图1所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010092626.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种夹取方便的机器人抓手
- 下一篇:数据传输方法、装置、存储介质及电子终端