[发明专利]一种基于候选区域面积和宽高的自适应特征块提取方法在审
申请号: | 202010433564.X | 申请日: | 2020-05-21 |
公开(公告)号: | CN111611998A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 陈楚城;戴宪华 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 候选 区域 面积 自适应 特征 提取 方法 | ||
本发明涉及一种基于候选区域面积和宽高的自适应特征块提取方法,包括:(1)利用特征提取网络对输入图像进行特征提取;(2)通过特征金字塔网络构建检测特征图;(3)利用区域建议网络获取候选区域;(4)通过自适应特征块提取方法获取候选区域的最终特征块;(5)获取检测模型的分类误差和回归误差,训练模型;(6)利用训练好的检测模型获取测试图像的目标位置和类别。本发明的方法可以有效利用多个检测特征图的信息,补充感受野信息的同时获取细节信息,从而提高检测模型在具有悬殊宽高比的目标上的检测性能,最终提高检测模型的整体检测。
技术领域
本发明涉及图像目标检测领域,即一种基于候选区域面积和宽高的自适应特征块提取方法。
背景技术
近年来,深度学习技术广泛应用于计算机视觉、自然语言处理和语音处理等多个领域中,并取得显著的成果。其中以深度学习中的卷积神经网络在图像处理领域的成果尤为显著,所取得的效果是传统算法无法比拟的。后来,科研人员将深度学习技术应用于目标检测技术中,提出一系列基于深度学习的目标检测算法,以提高检测模型的检测精度或者检测速度。科研人员为了解决目标物体的多尺度问题,提出了特征金字塔网络结构。
特征金字塔网络中是根据候选区域的面积大小来决定候选区域特征块从哪个检测特征图中获取。但是这种只根据候选区域面积大小的单一元素,当检测对象中存在具有悬殊宽高比的对象,检测模型的检测性能往往较低。这是由于候选区域的面积大小无法全面反映具有悬殊宽高比的对象的整体信息,导致候选区域特征块从不合理的检测特征图中获取,而该检测特征图无法提供充足的感受野和辅助定位的细节信息,因此检测模型的检测性能并不理想。
发明内容
为了克服现有技术存在的不足,本发明提出了一种解决上述难点的基于候选区域面积和宽高的自适应特征块提取方法。
为了实现以上目的,本发明提出的方法具体步骤如下:
(1)图像划分,将图像划分成训练集和测试集两部分,两个部分不存在相同的图像,训练集用来训练检测模型,测试集用来评估检测模型的性能,且训练集和测试集中不仅包含图像,还包含图像中目标对象的位置信息和类别信息;
(2)图像预处理,包括随机上下翻转、随机左右翻转和随机光照改变等,其中随机上下翻转、随机左右翻转和随机光照改变只针对训练集,特别的,当进行随机上下翻转和随机左右翻转的时候,目标对象的坐标信息也需要做出相应的变化;
(3)训练检测模型,将经过图像预处理后的训练集中的图像和标签信息输入到基于自适应特征块提取的带有特征金字塔网络的Faster R-CNN的检测模型中进行训练,获取各图像中目标对象的预测框和类别,并与实际的标签信息中的真实框和类别进行对比,计算出回归损失和分类损失,其中回归损失和分类损失包含了区域建议网络的损失还有第二阶段的损失,然后采用多学习任务的方法,利用带动量的梯度下降算法进行训练;
(4)测试检测模型,将测试集中的图像输入到训练好的基于自适应特征块提取的带有特征金字塔网络的Faster R-CNN的检测模型中进行检测,获得测试图像中目标对象的位置和类型,并统计检测模型的检测精度。
所述步骤(3)中训练包括构建检测特征图和获取正负样本的步骤、获取区域建议网络损失值的步骤、获取候选区域的步骤、通过自适应特征块提取方法获取候选区域最终特征块的步骤、获取第二阶段损失值的步骤和多任务学习的步骤。
如图1所示,所述步骤(3)具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010433564.X/2.html,转载请声明来源钻瓜专利网。