[发明专利]一种用于对金字塔特征图进行预测的算法在审

申请号：	202011069030.X	申请日：	2020-09-30
公开（公告）号：	CN112183649A	公开（公告）日：	2021-01-05
发明（设计）人：	杨淑爱;陈俊杰;李泽辉	申请（专利权）人：	佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/54;G06N3/04;G06Q10/04;G06T3/40;G06T7/73
代理公司：	广东广信君达律师事务所 44329	代理人：	江金城
地址：	528225 ***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于金字塔特征进行预测算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种用于对金字塔特征图进行预测的算法，包括：选取和划分数据集，并对数据集的输入的图片进行预处理操作；对类FCOS的网络架构的head部分进行修改并设为新网络结构；将输入数据送入backbone网络中获取输入数据的特征图，在特征图的每一点上面进行回归操作，进行网络训练获取网络模型；将预训练的网络模型应用到测试图片中，从特征金字塔的多个Head中获得预测的结果；本发明通过对其中预测网络部分的head网络采用轻量级简易的模型改进，得到不同层次上特征图的预测结果，再对金字塔特征图不同层次上的预测结果进行结合，得到最后预测结果，其准确率比起当前目标检测领域的SOAT方法有显著提升。

技术领域

本发明涉及图像处理技术领域，尤其涉及一种用于对金字塔特征图进行预测的算法。

背景技术

近年来，由于卷积神经网络(简称CNN)的发展和应用，许多计算机视觉领域的任务得到了较大的发展，其中目标检测的是计算机视觉中的一项重要的任务。目标检测是计算机视觉和数字图像处理的一个热门方向，广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域，通过计算机视觉减少对人力资本的消耗，具有重要的现实意义。因此，目标检测也就成为了近年来理论和应用的研究热点，它是图像处理和计算机视觉学科的重要分支，也是智能监控系统的核心部分，同时目标检测也是泛身份识别领域的一个基础性的算法，对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。由于深度学习的广泛运用，目标检测算法得到了较为快速的发展，基于深度学习的两种目标检测算法思路，分别为One-Stage目标检测算法和Two-Stage目标检测算法。

目前主流的目标检测算法主要是基于深度学习模型，大概可以分成两大类别：(1)One-Stage目标检测算法，这类检测算法不需要产生候选区域框的阶段，可以通过一个Stage直接产生物体的类别概率和位置坐标值，比较典型的算法有YOLO、SSD和CornerNet；(2)Two-Stage目标检测算法，这类检测算法将检测问题划分为两个阶段，第一个阶段首先产生候选区域(Region Proposals)，包含目标大概的位置信息，然后第二个阶段对候选区域进行分类和位置精修，这类算法的典型代表有R-CNN，Fast R-CNN，Faster R-CNN等。目标检测模型的主要性能指标是检测准确度和速度，其中准确度主要考虑物体的定位以及分类准确度。一般情况下，Two-Stage算法在准确度上有优势，而One-Stage算法在速度上有优势。不过，随着研究的发展，两类算法都在两个方面做改进，均能在准确度以及速度上取得较好的结果。在申请研究的目标检测算法是基于One-Stage的，它针对近来很热门的密集目标检测器，其准确率比起目前最先进的算法都有所提升。滑动窗口目标检测器，它在密集且规则的网格上生成边界框预测，在现代物体检测中起着至关重要的作用。目前这种检测器大多都是基于限定框的一个点去进行预测的，这样得到的特征可能不具有代表性，所以后面有人提出通过引入更多更强的特征，但很多这些增加的操作会由于引入了背景噪声带来有害的信息。然而这些方法没有显式地提取边界特征，本申请认为边界极限点特征对边界框的定位比较重要，并且在每个边界处选取最有效的特征，用简洁高效的方法来完成特征的提取，因此，现有技术需要进一步改进和完善。

发明内容

本发明的目的在于克服现有技术的不足，提供一种用于对金字塔特征图进行预测的算法。

本发明的目的通过下述技术方案实现：

一种用于对金字塔特征图进行预测的算法，该算法主要包括如下具体步骤：

步骤S1：选取和划分数据集，并对数据集的输入的图片进行预处理操作。

进一步的，所述S1步骤还包括：

步骤S11：采用当前较为流行的COCO目标检测类别数据集，按照常规的做法，训练集采用COCO trainval35k set(115K images)，验证集采用COCO minival set(5Kimages)，测试集采用test-dev set(20K images)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司，未经佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011069030.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种AI元数据的综合处理方法和系统
下一篇：一种用于预制混凝土方涵制造的振捣装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于对金字塔特征图进行预测的算法在审

专利文献下载