[发明专利]一种用于对金字塔特征图进行预测的算法在审

专利信息
申请号: 202011069030.X 申请日: 2020-09-30
公开(公告)号: CN112183649A 公开(公告)日: 2021-01-05
发明(设计)人: 杨淑爱;陈俊杰;李泽辉 申请(专利权)人: 佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06K9/54;G06N3/04;G06Q10/04;G06T3/40;G06T7/73
代理公司: 广东广信君达律师事务所 44329 代理人: 江金城
地址: 528225 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 金字塔 特征 进行 预测 算法
【说明书】:

发明公开了一种用于对金字塔特征图进行预测的算法,包括:选取和划分数据集,并对数据集的输入的图片进行预处理操作;对类FCOS的网络架构的head部分进行修改并设为新网络结构;将输入数据送入backbone网络中获取输入数据的特征图,在特征图的每一点上面进行回归操作,进行网络训练获取网络模型;将预训练的网络模型应用到测试图片中,从特征金字塔的多个Head中获得预测的结果;本发明通过对其中预测网络部分的head网络采用轻量级简易的模型改进,得到不同层次上特征图的预测结果,再对金字塔特征图不同层次上的预测结果进行结合,得到最后预测结果,其准确率比起当前目标检测领域的SOAT方法有显著提升。

技术领域

本发明涉及图像处理技术领域,尤其涉及一种用于对金字塔特征图进行预测的算法。

背景技术

近年来,由于卷积神经网络(简称CNN)的发展和应用,许多计算机视觉领域的任务得到了较大的发展,其中目标检测的是计算机视觉中的一项重要的任务。目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。由于深度学习的广泛运用,目标检测算法得到了较为快速的发展,基于深度学习的两种目标检测算法思路,分别为One-Stage目标检测算法和Two-Stage目标检测算法。

目前主流的目标检测算法主要是基于深度学习模型,大概可以分成两大类别:(1)One-Stage目标检测算法,这类检测算法不需要产生候选区域框的阶段,可以通过一个Stage直接产生物体的类别概率和位置坐标值,比较典型的算法有YOLO、SSD和CornerNet;(2)Two-Stage目标检测算法,这类检测算法将检测问题划分为两个阶段,第一个阶段首先产生候选区域(Region Proposals),包含目标大概的位置信息,然后第二个阶段对候选区域进行分类和位置精修,这类算法的典型代表有R-CNN,Fast R-CNN,Faster R-CNN等。目标检测模型的主要性能指标是检测准确度和速度,其中准确度主要考虑物体的定位以及分类准确度。一般情况下,Two-Stage算法在准确度上有优势,而One-Stage算法在速度上有优势。不过,随着研究的发展,两类算法都在两个方面做改进,均能在准确度以及速度上取得较好的结果。在申请研究的目标检测算法是基于One-Stage的,它针对近来很热门的密集目标检测器,其准确率比起目前最先进的算法都有所提升。滑动窗口目标检测器,它在密集且规则的网格上生成边界框预测,在现代物体检测中起着至关重要的作用。目前这种检测器大多都是基于限定框的一个点去进行预测的,这样得到的特征可能不具有代表性,所以后面有人提出通过引入更多更强的特征,但很多这些增加的操作会由于引入了背景噪声带来有害的信息。然而这些方法没有显式地提取边界特征,本申请认为边界极限点特征对边界框的定位比较重要,并且在每个边界处选取最有效的特征,用简洁高效的方法来完成特征的提取,因此,现有技术需要进一步改进和完善。

发明内容

本发明的目的在于克服现有技术的不足,提供一种用于对金字塔特征图进行预测的算法。

本发明的目的通过下述技术方案实现:

一种用于对金字塔特征图进行预测的算法,该算法主要包括如下具体步骤:

步骤S1:选取和划分数据集,并对数据集的输入的图片进行预处理操作。

进一步的,所述S1步骤还包括:

步骤S11:采用当前较为流行的COCO目标检测类别数据集,按照常规的做法,训练集采用COCO trainval35k set(115K images),验证集采用COCO minival set(5Kimages),测试集采用test-dev set(20K images)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司,未经佛山市南海区广工大数控装备协同创新研究院;佛山市广工大数控装备技术发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011069030.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top