[发明专利]图像特征提取、训练、检测方法及模块、装置、系统有效
申请号: | 201310218938.6 | 申请日: | 2013-06-04 |
公开(公告)号: | CN103345631A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 魏代猛;赵勇;黎国梁;程如中;李晶晶 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/66 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 郭燕;彭家恩 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 特征 提取 训练 检测 方法 模块 装置 系统 | ||
技术领域
本申请涉及图像处理领域,尤其涉及一种图像特征提取、训练、检测方法及模块、装置、系统。
背景技术
物体检测是计算机视觉的核心问题之一。基于统计学的物体检测方法主要是通过机器学习,从一系列训练数据中训练得到一个分类器,然后利用分类器对输入窗口进行识别。物体检测方法关键的有两点,其一是特征提取,其二是分类器设计。特征提取的目的是降低数据的维数,得到能反映物体属性的特征,从而方便分类。好的特征应当具有区分能力强、计算简单、鲁棒性强和形式简单等特点。分类器设计属于机器学习范畴,其目的是得到一个计算复杂度较低且推广性较好的分类器。
梯度直方图(Histogram of Oriented Gradients,HOG)特征是一种用来进行物体检测的特征描述子,它通过计算和统计图像局部区域的HOG来构成特征。HOG特征结合分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。现有的HOG特征提取方法大致如下述:首先,将灰度图像进行归一化,以调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时抑制噪音干扰;然后,计算图像中每个像素的梯度(包括梯度大小和梯度方向)形成梯度图像,以捕获轮廓信息,进一步弱化光照的干扰;其次,对梯度图像划分细胞单元(cell),例如,cell大小可为6像素×6像素大小;再者,统计每个cell的HOG,形成每个cell的描述子;进一步地,将几个cell组成块(block),例如,每个block包含9个cell(两个方向上均为3个cell),一个block内的所有cell的HOG级联便得到该block的HOG描述子;最后,将整个图像内所有block的HOG描述子级联,即可得到整个图像的HOG特征了。
但是,现有的HOG特征提取方法的检测率仍然较低,限制了其在物体检测中的推广应用。
发明内容
本申请提供一种图像特征提取、训练、检测方法及模块、装置、系统,以提高物体检测的检测率。
根据本申请的第一方面,本申请提供一种图像特征提取方法,包括:
采用第一扫描窗以第一预设定步长对原始梯度图像进行扫描,得到所述原始梯度图像中各第一扫描区域对应的、用于表征所述第一扫描区域梯度大小及方向信息的N维度向量,其中,N取正整数;并进行如下处理,得到N个方向图像:将第x个第一扫描区域对应的第n维度向量映射到第n个方向图像的第x映射单位中,其中,n∈(1,2,……,N),x∈(1,2,……,X),X为第一扫描区域的数量;
对每个所述方向图像进行如下处理:以预设定大小的单元格划分所述方向图像,每个所述单元格包含多个映射单位;采用第二扫描窗以第二预设定步长对所述划分后的方向图像进行扫描,得到所述方向图像中各第二扫描区域对应的、用于表征所述第二扫描区域梯度大小信息的M维度向量,其中,M取正整数;组合每个所述方向图像各所述第二扫描区域的M维度向量,得到方向图像特征;
组合各所述方向图像特征,得到所述原始梯度图像对应的附加梯度方向直方图特征。
根据本申请的第二方面,本申请提供一种训练方法,包括:
采集物体图像集及背景图像集;
对所述物体图像集及背景图像集中各待处理图像提取特征;
使用所述特征进行训练,得到用于区分物体及背景的分类器,
对所述物体图像集及背景图像集中各待处理图像提取特征具体包括:
获得所述待处理图像的原始梯度图像;
由所述原始梯度图像得到待处理图像的主梯度方位直方图特征,其中,采用第一扫描窗以第一预设定步长对所述原始梯度图像进行扫描,得到所述原始梯度图像中各第一扫描区域对应的、用于表征所述第一扫描区域梯度大小及方向信息的N维度向量,其中,N取正整数;
进行如下处理,得到N个方向图像:将第x个第一扫描区域对应的第n维度向量映射到第n个方向图像的第x映射单位中,其中,n∈(1,2,……,N),x∈(1,2,……,X),X为第一扫描区域的数量;对每个所述方向图像进行如下处理:以预设定大小的单元格划分所述方向图像,每个所述单元格包含多个映射单位;采用第二扫描窗以第二预设定步长对所述划分后的方向图像进行扫描,得到所述方向图像中各第二扫描区域对应的、用于表征所述第二扫描区域梯度大小信息的M维度向量,其中,M取正整数;组合每个所述方向图像各所述第二扫描区域的M维度向量,得到方向图像特征;组合各所述方向图像特征,得到所述原始梯度图像对应的附加梯度方向直方图特征,以使用所述附加梯度方向直方图特征及主梯度方位直方图特征进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310218938.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:风扇马达
- 下一篇:泵送混凝土速效防坍恢复剂
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序