[发明专利]一种基于网格判断的快速目标检测方法有效
申请号: | 201610880557.8 | 申请日: | 2016-10-09 |
公开(公告)号: | CN107247956B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 李宏亮;李威 | 申请(专利权)人: | 成都快眼科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06K9/00;G06K9/32 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 冯龙 |
地址: | 610000 四川省成都市双*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网格 判断 快速 目标 检测 方法 | ||
本发明公开了一种基于网格判断的快速目标检测方法,所述方法包括:步骤1:将图像进行网格划分;步骤2:提取网格区域的特征;步骤3:对网格进行判断及合并,具体为:首先,根据事先训练的回归模型判断每个网格是否属于指定的目标对象,然后根据各个网格所属的对象类别,将网格合并组成初始对象窗口;步骤4:利用边框回归方法对初始对象窗口进行边框回归处理,实现了能够同时保证目标检测精度和速度的技术效果。
技术领域
本发明涉及图像处理领域,具体地,涉及一种基于网格判断的快速目标检测方法。
背景技术
视觉是人类获取外界信息的重要途径,能够带给人更直观、丰富的感观体验。图像目标检测是计算机视觉应用中的关键问题。其实现手段是:输入一幅待处理的图像,让计算机从语义的角度理解静态图像、视频,从中识别出事先指定类别的目标(例如人类,动物,交通工具等常见对象),并且指出目标所处的位置,以及目标的大小(通常用矩形边框来表示)。
早期的研究主要是基于级联结构检测模型。首先提取人脸的特征,然后利用积分图和Adaboost思想对提取的人脸特征进行判别,取得了高效准确的检测效果。随后学者们提出了一系列鲁棒的特征,如Haar-like,SIFT,HOG。这些特征联合Bag-of-word,Fishervector等模型,目标检测任务的准确率和效率都有了较大提高。但是,这类模型往往依赖复杂的特征,其性能很大程度上取决于特征的优化选择,所以其发展陷入了瓶颈期,诸多改进并没有实质性地提高目标检测的性能。
基于可变形部件模型的检测模型这些年来颇有收获,如基于HOG特征的可变形部件的对象检测,不仅考虑了整个对象,还充分考虑了部件间的形变关系,进一步提升了目标检测的性能。但是仍然存在不少问题,对于遮挡,大幅度形变问题,该模型有一定的局限性。
近年来,深度学习受到学术和工程上的广泛关注,“大数据+深度模型”成为了人工智能领域的热搜词。它的主要特点是通过设计多层的神经网络,对输入的多媒体数据进行不同层次的抽象,最后进行类别的预测和识别。深度学习被成功应用于包括图像识别领域,图像检测领域,并大幅度地提升了准确度。目前基于区域的卷及神经网络(R-CNN)及其改进已成为主流的目标检测器。R-CNN主要分为三个步骤,即:区域选择,特征提取,分类器打分。基本框图如图1所示。
(1)区域提取:由于目标对象可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,首先需要选取初始可能包含对象的区域。传统的区域选择方法是基于滑动窗口的策略。首先设定不同的尺度、长宽比的窗口,然后对整幅图像进行遍历滑动。这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。实际上,由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不能得到很好的区域。针对滑动窗策略的不足,近年来学者提出了许多优秀的区域选择方法,主要可以分为:基于超像素的方法、基于窗口打分的方法,以及基于深度学习的方法,代表性的工作有:选择性查找,EdgeBox,RPN等等。
(2)特征提取:提取图像区域特征的好坏直接影响到分类的准确性。由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征面临着挑战。传统方法采用手动设计的特征有SIFT特征,HOG特征。近年来主流的方法均采用深度卷积提取特征,并取得了突飞猛进的效果。
(3)分类器打分:将待测提取的图像窗口的特征送入训练好的分类器中进行分类,最终输出图像窗口的类别信息。目前比较常用的分类算法有SVM、Adaboost以及卷及神经网络。
一个非常好的目标检测系统,需要满足以下几个条件:
1、较高的检测准确率;
2、较高的计算效率;
3、具有不同场景的泛化能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都快眼科技有限公司,未经成都快眼科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610880557.8/2.html,转载请声明来源钻瓜专利网。