[发明专利]一种图像分类方法有效
申请号: | 201510168725.6 | 申请日: | 2015-04-10 |
公开(公告)号: | CN104778476B | 公开(公告)日: | 2018-02-09 |
发明(设计)人: | 解梅;马争;张达明;于国辉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 电子科技大学专利中心51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 | ||
技术领域
本发明属于数字图像处理技术领域。
背景技术
图像理解是一个转变“像素值决定”的过程:它将以图标形式的图像表示方式转化为另一种知识符号的形式,也即是图像的各个像素块内包含了怎样的内容。其中,图像分类是图像理解的一个分支,它在基于内容的图像检索、物体分类与识别和场景分类中具有广泛的应用。在计算机视觉中,一个基本的问题是怎样让计算机像人类一样“看”事物。实际中,虽然我们每一秒内都接受巨大数量的视觉数据,但是我们几乎并没有意识到我们正在以相当快的速度处理它们。对物体,比如桌子、乒乓球或者一个高山流山场景进行分类,进行分类更是非常容易的事情。但目前机器人的视觉与人眼的视觉是无法比拟的。
人工智能结合了计算机科学、神经科学、数学、心理学、哲学和认知科学等领域的工作。与此同时,在许多领域都去了很大的进步。例如,在认知科学方面的进步使我们有足够的理由相信,我们的大脑处理信息是以“至上而下”的方式,而不是“至下而上”的方式。结合认知科学上取得的成果,图像分类主要采取类似的两种不同的技术路线:一种是“至下而上”的方法,利用图像中物体的类别来判定图像的类别;另一种是“至上而下”的方法,直接从整幅图像来判定图像的类别。
目前,较多的研究都聚焦在了第二种技术路线上。从而,避开了图像分割,并通过融合一个图像的全局特征来进行分类。
采用“自上而下”技术路线。此种技术由于避开了图像分割,从而使图像分类任务变得简明和有效。主要的思路是首先提取出图像的全局或者局部特征;然后,对这些特征进行编码;接下里,进行向量的池化;最后,用分类器进行分类。比如,文献Chang E,Goh K,Sychay G,et al.CBSA:content-based soft annotation for multimodal image retrieval using Bayes point machines[J].Circuits and Systems for Video Technology,IEEE Transactions on,2003,13(1):26-38中提到了全局特征;文献Szummer M,Picard R W.Indoor-outdoor image classification[C]//Content-Based Access of Image and Video Database,1998.Proceedings.,1998IEEE International Workshop on.IEEE,1998:42-51使用全局特征来对图像进行分类。
常用的图像分类算法框架有:
空间金字塔匹配SPM:Lazebnik S,Schmid C,Ponce J.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories[C]//Computer Vision and Pattern Recognition,2006IEEE Computer Society Conference on.IEEE,2006,2:2169-2178.
基于稀疏编码的空间金字塔匹配ScSPM:Yang J,Yu K,Gong Y,et al.Linear spatial pyramid matching using sparse coding for image classification[C]//Computer Vision and Pattern Recognition,2009.CVPR 2009.IEEE Conference on.IEEE,2009:1794-1801.
SPM方法需要用到非线性核,训练时间较长;ScSPM方法编码时间过长,抵消了后面运用线性核的整体效果。
发明内容
本发明所要解决的技术问题是,提供一种能同时提升分类精度与效率的图像分类方法。
本发明为解决上述技术问题所采样的技术方案是,一种图像分类方法,包括以步骤:
1)训练阶段:
对训练样本图像同时提取SIFT特征与协方差矩阵特征;
对图像的SIFT特征与图像的协方差矩阵特征分别进行局部约束线性编码LLC得到图像的SIFT特征稀疏编码与图像的协方差矩阵特征稀疏编码;
SIFT特征稀疏编码经基于空间金字塔匹配SPM框架的池化处理后得到图像的SIFT特征表示,协方差矩阵特征稀疏编码经池化后得到图像的协方差特征表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510168725.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序