[发明专利]一种用于对金字塔特征图进行预测的算法在审
申请号: | 202011069030.X | 申请日: | 2020-09-30 |
公开(公告)号: | CN112183649A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 杨淑爱;陈俊杰;李泽辉 | 申请(专利权)人: | 佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/54;G06N3/04;G06Q10/04;G06T3/40;G06T7/73 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 江金城 |
地址: | 528225 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 金字塔 特征 进行 预测 算法 | ||
本发明公开了一种用于对金字塔特征图进行预测的算法,包括:选取和划分数据集,并对数据集的输入的图片进行预处理操作;对类FCOS的网络架构的head部分进行修改并设为新网络结构;将输入数据送入backbone网络中获取输入数据的特征图,在特征图的每一点上面进行回归操作,进行网络训练获取网络模型;将预训练的网络模型应用到测试图片中,从特征金字塔的多个Head中获得预测的结果;本发明通过对其中预测网络部分的head网络采用轻量级简易的模型改进,得到不同层次上特征图的预测结果,再对金字塔特征图不同层次上的预测结果进行结合,得到最后预测结果,其准确率比起当前目标检测领域的SOAT方法有显著提升。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种用于对金字塔特征图进行预测的算法。
背景技术
近年来,由于卷积神经网络(简称CNN)的发展和应用,许多计算机视觉领域的任务得到了较大的发展,其中目标检测的是计算机视觉中的一项重要的任务。目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。由于深度学习的广泛运用,目标检测算法得到了较为快速的发展,基于深度学习的两种目标检测算法思路,分别为One-Stage目标检测算法和Two-Stage目标检测算法。
目前主流的目标检测算法主要是基于深度学习模型,大概可以分成两大类别:(1)One-Stage目标检测算法,这类检测算法不需要产生候选区域框的阶段,可以通过一个Stage直接产生物体的类别概率和位置坐标值,比较典型的算法有YOLO、SSD和CornerNet;(2)Two-Stage目标检测算法,这类检测算法将检测问题划分为两个阶段,第一个阶段首先产生候选区域(Region Proposals),包含目标大概的位置信息,然后第二个阶段对候选区域进行分类和位置精修,这类算法的典型代表有R-CNN,Fast R-CNN,Faster R-CNN等。目标检测模型的主要性能指标是检测准确度和速度,其中准确度主要考虑物体的定位以及分类准确度。一般情况下,Two-Stage算法在准确度上有优势,而One-Stage算法在速度上有优势。不过,随着研究的发展,两类算法都在两个方面做改进,均能在准确度以及速度上取得较好的结果。在申请研究的目标检测算法是基于One-Stage的,它针对近来很热门的密集目标检测器,其准确率比起目前最先进的算法都有所提升。滑动窗口目标检测器,它在密集且规则的网格上生成边界框预测,在现代物体检测中起着至关重要的作用。目前这种检测器大多都是基于限定框的一个点去进行预测的,这样得到的特征可能不具有代表性,所以后面有人提出通过引入更多更强的特征,但很多这些增加的操作会由于引入了背景噪声带来有害的信息。然而这些方法没有显式地提取边界特征,本申请认为边界极限点特征对边界框的定位比较重要,并且在每个边界处选取最有效的特征,用简洁高效的方法来完成特征的提取,因此,现有技术需要进一步改进和完善。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于对金字塔特征图进行预测的算法。
本发明的目的通过下述技术方案实现:
一种用于对金字塔特征图进行预测的算法,该算法主要包括如下具体步骤:
步骤S1:选取和划分数据集,并对数据集的输入的图片进行预处理操作。
进一步的,所述S1步骤还包括:
步骤S11:采用当前较为流行的COCO目标检测类别数据集,按照常规的做法,训练集采用COCO trainval35k set(115K images),验证集采用COCO minival set(5Kimages),测试集采用test-dev set(20K images)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司,未经佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011069030.X/2.html,转载请声明来源钻瓜专利网。