[发明专利]一种基于候选区域面积和宽高的自适应特征块提取方法在审

申请号：	202010433564.X	申请日：	2020-05-21
公开（公告）号：	CN111611998A	公开（公告）日：	2020-09-01
发明（设计）人：	陈楚城;戴宪华	申请（专利权）人：	中山大学
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于候选区域面积自适应特征提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于候选区域面积和宽高的自适应特征块提取方法，其特征在于包括如下步骤：

(1)图像划分，将图像划分成训练集和测试集两部分，两个部分不存在相同的图像，训练集用来训练检测模型，测试集用来评估检测模型的性能，且训练集和测试集中不仅包含图像，还包含图像中目标对象的位置信息和类别信息；

(2)图像预处理，包括随机上下翻转、随机左右翻转和随机光照改变等，其中随机上下翻转、随机左右翻转和随机光照改变只针对训练集，特别的，当进行随机上下翻转和随机左右翻转的时候，目标对象的坐标信息也需要做出相应的变化；

(3)训练检测模型，将经过图像预处理后的训练集中的图像和标签信息输入到基于自适应特征块提取的带有特征金字塔网络的Faster R-CNN的检测模型中进行训练，获取各图像中目标对象的预测框和类别，并与实际的标签信息中的真实框和类别进行对比，计算出回归损失和分类损失，其中回归损失和分类损失包含了区域建议网络的损失还有第二阶段的损失，然后采用多学习任务的方法，利用带动量的梯度下降算法进行训练；

(4)测试检测模型，将测试集中的图像输入到训练好的基于自适应特征块提取的带有特征金字塔网络的Faster R-CNN的检测模型中进行检测，获得测试图像中目标对象的位置和类型，并统计检测模型的检测精度。

2.根据权利要求1所述的一种基于候选区域面积和宽高的自适应特征块提取方法，其特征是：

所述步骤(3)中训练包括构建检测特征图和获取正负样本的步骤、获取区域建议网络损失值的步骤、获取候选区域的步骤、通过自适应特征块提取方法获取候选区域最终特征块的步骤、获取第二阶段损失值的步骤和多任务学习的步骤。

3.根据权利要求2所述的一种基于候选区域面积和宽高的自适应特征块提取方法，其特征是：所述步骤(3)具体为：

(3.1)构建带有特征金字塔网络的Faster R-CNN检测模型，其中骨干网络是ResNet50。输入图像经过骨干网络进行特征提取后形成不同大小的特征图，浅层的特征图的分辨率较大，包含的细节信息较多但语义信息较少；深层的特征图的分辨率较小，包含的细节信息较少但语义信息较多。通过从上而下和横向连接的方式构建检测特征图，形成特征金字塔网络。对这些检测特征图通过卷积操作预测不同特征图上不同特征点映射回原图上的点的若干个anchors的前背景分类概率和相对平移缩放参数，同时不同检测特征图上不同特征点映射到原图上的点对应的anchors与真实框计算交并比，如果与真实框的交并比最高或者与任意真实框的交并比大于0.7的anchor则认为是正样本，而与所有真实框的交并比都小于0.3的anchor则认为是负样本；

(3.2)从正负样本集中分别选择128个正样本和128个负样本，组成正负样本比例为1:1的正负样本集。如果正样本集中正样本的数目不足128个，则取出所有正样本，并从负样本从选取若干个负样本，组成256个正负样本。如果正样本集中正样本的数目多于128个，则采用随机采样的方式获取128个正样本。如果负样本集中负样本的数目多于128个，也采用随机采样的方式获取128个负样本。正样本在此的类别为前景，负样本在此的类别为背景，同时可以获取正样本与对应真实框之间的真实平移缩放参数。利用正负样本的类别和模型预测的前背景概率值，利用交叉熵损失函数计算分类损失。利用正样本与对应真实框的真实平移缩放参数和模型预测的相对平移缩放参数，利用smoothL1函数计算回归损失。最终合并分类损失和回归损失，获取区域建议网络的损失值；

(3.3)通过区域建议网络的预测平移缩放参数对anchor boxes进行位置调整，得到候选框。根据候选框的预测前景概率值大小，从5个检测特征图中分别获取2000个候选框，合计10000个候选框。对10000个候选框进行非极大值抑制操作，并获取前景概率值最大的2000个候选框作为候选区域；

(3.4)获取候选区域的面积、宽度和高度，并根据这些信息获取相应的检测特征图，然后根据候选区域在原图中的位置和感受野计算，获取候选区域在相应检测特征图上的特征块。接着对这些特征块分别通过RoI pooling层，得到维度一致的候选区域特征块。最后对这些候选区域特征块进行自适应融合，获取候选区域的最终特征块。其中自适应融合是一种逐点取最大值的方式进行融合。

(3.5)利用候选区域的最终特征块通过全连接层，获取细分类的类别置信度和预测相对平移缩放参数，计算出细分类误差和回归误差，其中分类损失是采用交叉熵损失函数，回归损失是采用smoothL1函数。合并第二阶段的分类损失和回归损失，得到第二阶段的损失值；

(3.6)合并区域建议网络的损失值和第二阶段的损失值，得到检测模型总的损失值，利用带动量的梯度下降算法进行训练。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010433564.X/1.html，转载请声明来源钻瓜专利网。

上一篇：一种新冠肺炎磨玻璃病灶造影解析方法、系统及存储介质
下一篇：柔性盖板及柔性显示屏

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于候选区域面积和宽高的自适应特征块提取方法在审

专利文献下载