[发明专利]一种图像特征提取方法及装置在审
申请号: | 201510229858.X | 申请日: | 2015-05-07 |
公开(公告)号: | CN104866855A | 公开(公告)日: | 2015-08-26 |
发明(设计)人: | 张世周;龚怡宏;柴振华 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 特征 提取 方法 装置 | ||
技术领域
本发明涉及通信技术,尤其涉及一种图像特征提取方法及装置。
背景技术
特征提取是许多计算机视觉分析任务(如场景识别、物体识别、目标检测)的关键步骤。因此,如何提取判别性强、鲁棒性高的特征一直是一个研究热点。传统意义上,研究人员的精力主要放在如何手工设计具有尺度、视点、光照以及类内差异等等不变性的图像特征。但是手工设计图像特征,需要研究人员具有非常专业的领域知识,挑战性很强。因此,像尺度不变性特征转换(SIFT,Scale-invariant Feature Transformation)、方向梯度直方图(HOG,Histogram of Oriented Gradients)、局部二进制模式(LBP,Local Binary Pattern)等鲁棒性较好的图像特征非常稀少,通常每5到10年才能设计出一项较好的手工特征。此外,手工设计的特征通常在某些视觉任务中表现出色,但在另外一些任务中却表现一般,例如LBP在人脸识别领域赢得了广泛的声誉,而HOG主要是因为行人检测而出名。
近年来的研究热点一直关注于如何从数据中直接学习得到特征表示。广受关注的是卷积神经网络模型(CNN,Convolutional Neural Network),大规模视觉识别挑战赛中图像分类比赛的冠军都是基于CNN的模型。
图1所示为一个卷积神经网络的结构示意图,CNN通过对局部感受野进行一系列的卷积,池化等操作,得到图像的特征表示。在图像特征进行池化之后,需要将池化后的图像特征与标注的图像样本进行比对,根据比对结果进行误差反传,逐渐调整优化模型参数,最终理想的图像特征。CNN在训练过程中需要大量有标注的数据样本,例如,ImageNet大规模视觉识别挑战赛中的训练图片有超过一百万张,整个ImageNet数据集有超过一千万张的标注图片数据。尽管如此,对于训练一个超大的CNN模型来说,标注数据量仍显得不足。更加不用说标注一个超大规模的数据集所需要耗费的人力、财力。因此,研究如何从海量的无标注信息的数据当中无监督式的学习(unsupervised learning)得到判别性较强的特征,显得更加有意义一些,也历来就是学术界研究的热点。
在实际应用中,训练一个大规模的CNN模型同时其训练结果具有良好的性能并不是一件容易的事情,因为CNN的训练严重依赖已标注的大数据训练样本,虽然ImageNet已经有众多的标注样本,但是对于实际生活中的数据来说还远远不够。互联网上每天都会有海量的图片、视频数据上传,难以对海量新增的图片样本进行标注。
发明内容
本发明实施例提供了一种图像特征提取方法及装置,用于在无监督图像训练过程中进行高效的图像特征提取。
本发明实施例第一方面提供的图像特征提取方法,包括:
对输入图像的待提取像素所在的图像区域内的区域像素进行稀疏编码,从而得到所述区域像素的M维的编码系数,M为大于0的整数;
根据所述区域像素的编码系数,获得所述图像区域对应的M个稀疏编码图,其中,所述M个稀疏编码图中的第k个稀疏编码图中任意坐标点的值为所述任意坐标点对应在所述图像区域内的像素的编码系数在第k个维度下的值,k为小于等于M的正整数;
分别对所述M个稀疏编码图进行池化处理,从而得到所述待提取像素的M维的池化特征,所述M个稀疏编码图与所述池化特征的M个维度一一对应;
对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度。
结合第一方面,在第一种可能的实现方式中,所述对输入图像的待提取像素所在的图像区域内的区域像素进行稀疏编码,从而得到所述区域像素的M维的编码系数包括:
对所述区域像素对应的像素样本进行稀疏编码,从而得到所述区域像素的M维的编码系数;
其中,根据以下公式求取所述区域像素的编码系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510229858.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序