[发明专利]一种词袋图像分类方法有效
申请号: | 201510683226.0 | 申请日: | 2015-10-20 |
公开(公告)号: | CN105303195B | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 阎刚;于洋;郭迎春;刘依;师硕;张亚娟;杨悦强 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 胡安朋 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 | ||
本发明一种词袋图像分类方法,涉及应用电子设备进行识别图形的方法,是一种基于距离次序的视觉单词权重分配的词袋图像分类方法,步骤是:对图像进行分块并提取特征;对获得的特征进行聚类生成“视觉单词词汇表”;计算待分配“视觉单词”的权重;结合空间金字塔理论获得每幅图像的最终直方图表示;利用支持向量机对待测图像进行分类,最后输出图像类别。本发明方法克服了现有图像分类技术存在单一的特征不能完全代表图像的信息和图像分类存在准确率不高的缺陷。
技术领域
本发明的技术方案涉及应用电子设备进行识别图形的方法,具体地说是一种词袋图像分类方法。
背景技术
随着人类进入信息化社会,国际互联网的快速发展使得信息量以指数化的速度增长,互联网上大量未被分类的数字图像作为一个巨大的挑战摆在了人们面前,传统的人工手动标注和分类不仅在时间上而且在效率上都不再能够适应要求,这就需要自动的图像类别标注和分类方法来应对这一挑战。
近年来,词袋算法在图像分类领域取得了巨大的成就,现有的词袋算法首先对图像中的局部兴趣点(特征点)进行提取SIFT特征,根据聚类映射到“视觉单词词汇表”的某一个“视觉单词”中,统计“视觉单词”个数作为图像的统计直方图,经过训练学习,用分类器完成图像的分类。
现有方法中,提取SIFT特征需要构建尺度空间,运算耗时并且得到的兴趣点数目有限,研究人员在传统的词袋算法上进行了改进。2004年美国卡内基美隆大学的Ke针对SIFT维数较高的问题,利用主成分分析方法(PCA)和SIFT相结合提出基于PCA-SIFT 方法的词袋算法,将局部兴趣点的特征维数从128维降低到36维,降低了时间复杂度,但是维数降低使得所用的训练图像需要具有较强的代表性才会得到较好的效果,且时间复杂度仍然较高。2008年Bay等人提出了SURF特征描述子,词袋算法利用SURF提取特征,大大的降低了时间复杂度,但是该描述子在图像尺度和旋转变化时表现不如SIFT描述子。法国里昂中央理工大学的Zhu等人在2011年提取图像特征时采用一种新的快速局部描述子DAISY,建模中仍然使用词袋算法,对于同样的识别率,DAISY的时间上要比 SIFT快12倍,但是DAISY描述子的特征维数仍然很高,缺乏更紧凑和多信息的特征表示。
在获取图像的特征后需要把获得到的众多局部特征点分配到“视觉单词词汇表”中的某一个“视觉单词”,现有的主流方法是在特征空间中计算待分配的局部特征点即“视觉单词”与“视觉词汇表”中每个“视觉单词”间的欧几里得距离,计算“视觉单词”的出现频次。该词频-逆文档频率TF-IDF算法用来评估一个字词的重要程度,有较高的召回率,但是没有考虑特征项在类间、类内和不完全分类的分布信息这些情况,使得在权重分配阶段得到的直方图信息有一定局限性。
CN201210043064.0公开了一种基于多特征融合的遥感图像分类方法,应用遥感图像的SIFT特征、颜色直方图特征和纹理特征作为词袋模型的局部特征,得到三个分类器并对待测图像进行分类预测,将预测结果加权得到最终结果,该方法在待分配“视觉单词”的权值分配阶段采用TF-IDF方法,得到的图像直方图具有局限性,在表示信息时致使分类结果产生较大误差。
目前图像分类在特征提取上仍然存在单一的特征不能完全代表图像的信息的问题,在“视觉单词”的权值分配中硬分配的思想忽略了待分配“视觉单词”对其他词汇的贡献,加上词袋算法中图像直方图区分效果不佳,导致图像分类存在准确率不高的缺陷。
发明内容
本发明所要解决的技术问题是:提供一种词袋图像分类方法,是一种基于距离次序的视觉单词权重分配的词袋图像分类方法,克服了现有图像分类技术存在单一的特征不能完全代表图像的信息和图像分类存在准确率不高的缺陷。
本发明解决该技术问题所采用的技术方案是:一种词袋图像分类方法,是一种基于距离次序的视觉单词权重分配的词袋图像分类方法,步骤如下:
第一步,对图像进行分块并提取特征:
(1)图像采集与预处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510683226.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:穿戴式金属二维码装置
- 下一篇:一种电网指标体系建立方法、装置以及计算设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序