[发明专利]一种用于对金字塔特征图进行预测的算法在审
申请号: | 202011069030.X | 申请日: | 2020-09-30 |
公开(公告)号: | CN112183649A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 杨淑爱;陈俊杰;李泽辉 | 申请(专利权)人: | 佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/54;G06N3/04;G06Q10/04;G06T3/40;G06T7/73 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 江金城 |
地址: | 528225 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 金字塔 特征 进行 预测 算法 | ||
1.一种用于对金字塔特征图进行预测的算法,其特征在于,包括如下步骤:
步骤S1:选取和划分数据集,并对数据集的输入的图片进行预处理操作;
步骤S2:搭建类FCOS的网络架构,对其中的head部分进行修改并设定为新网络结构;
步骤S3:将输入数据送入backbone网络中获取输入数据的特征图,在特征图的每一点上面进行回归操作,进行网络训练获取网络模型;
步骤S4:将预训练的网络模型应用到测试图片中,从特征金字塔的多个Head中获得预测的结果;
步骤S5:使用NMS等后处理操作获得最终的结果;用测试集对选出的模型进行测试,评估模型性能;将本模型的实验结果和SOTA的一些模型进行准确率和速度的比较,权衡下来得到的网络结构能够在速度和性能上得到理想的平衡,效果显著提升。
2.根据权利要求1所述的用于对金字塔特征图进行预测的算法,其特征在于,所述步骤S1还包括如下步骤:
步骤S11:采用COCO目标检测类别数据集,训练集采用COCO trainval35k set(115Kimages),验证集采用COCO minival set(5K images),测试集采用test-dev set(20Kimages)。
3.根据权利要求1所述的用于对金字塔特征图进行预测的算法,其特征在于,所述步骤S1中,预处理操作包括均值化、去雾、裁剪操作。
4.根据权利要求1所述的用于对金字塔特征图进行预测的算法,其特征在于,所述的S2步骤还包括如下步骤:
步骤S21:所述新网络结构由三部分组成,分别是主干网络(backbone network),特征金字塔网络FPN(Feature Pyramid Networks),以及预测网络;
步骤S22:所述主干网络的选取采用残差网络(ResNet-50)来提取特征,每层卷积模块结构类似,都是采用多个bottleneck残差块组成,每层模块中的第一层都要做下采样,通过用3*3的卷积核步长为2,作最大池化的操作;选取ResNet-5最后三个卷积模块,分别记为conv3、conv4、conv5,得到的特征图记为C3、C4、C5;
步骤S23:FPN特征金字塔网络是由主干网络提取特征后的不同维度的特征图经过相加操作得到的,对于该部分的网络也可以分为两部分,上采样部分和下采样部分;FPN特征金字塔网络结合网络的浅层特征和深层特征,然后在多个分支同时输出不同大小的目标,充分使用网络的浅层特征和深层特征;
步骤S24:预测网络是对不同层级的特征层进行预测,不同特征层共享head网络,可以有效地提升检测器参数的效率,提升检测的性能,但是不同的特征层对应不同的回归尺寸范围(P3是[0,64],P4是[64,128]),每个head网络结构都相同,都包含有回归分支和分类分支,并且每条分支经过四个卷积层后再分为两支,一支经过边界对齐模块,一个不作处理;新加入了两条连有边界对齐模块的支路,得到经过边界信息提取的边界特征图,然后根据这些新的分类得分和边框位置和旧的相结合,得到更新后的分类得分和边框位置;能够突出边框的边界信息,并且能有效提升预测的性能。
5.根据权利要求4所述的用于对金字塔特征图进行预测的算法,其特征在于,所述步骤S24还包括如下步骤:
步骤S241:对于预测网络中的边界对齐模块,它包含一个边界对齐操作器和两层1*1卷积层,它的作用是用来对特征图的信息增加其边界的敏感度,对于C个通道里表示着限定框的单点特征的特征图,先对其进行1*1的卷积改变通道数,后跟着一个实例正则化的操作,生成五倍于原先通道的特征图,4C通道中每C通道都表示着一条边界的信息,还有C通道表示着原来单点特征的信息,对于5C通道特征图,通过操作器进行边界对齐操作,然后再降维,还原为输入模块前的C通道特征图;
步骤S242:对于边界对齐操作器,用来显式、自适应的提取物体边界的特征,对于一个特征图,通道个数为5C,这是一个边界敏感的特征图,分别对应物体4个边界特征和原始锚点位置的特征,对于一个锚点预测的一个框,把这个框的4个边界对应在特征图上的特征分别做池化操作,且由于框的位置是小数,所以该操作使用双线性插值取出每个边界上的特征;关于该操作,每条边会先选出N个待采样点,再对这N个待采样点取最大的值,作为该条边的特征,即每条边最后只会选出一个采样点作为输出;那么每个锚点都会采样5个点的特征作为输出,即输出的通道数也为5C个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司,未经佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011069030.X/1.html,转载请声明来源钻瓜专利网。