[发明专利]基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法有效
申请号: | 201110340761.8 | 申请日: | 2011-11-02 |
公开(公告)号: | CN102509111A | 公开(公告)日: | 2012-06-20 |
发明(设计)人: | 孔祥维;贾世杰 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;关慧贞 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 局部 特征 多级 图像 距离 计算 商品 自动 分类 算法 | ||
技术领域
本发明涉及的是一种商品图像的自动分类方法,具体是一种基于局部特征分级聚类及图像-类距离计算的商品图像分类算法。
背景技术
随着互联网的发展,电子商务的逐渐普及。电子商务网站需要通过对在线销售商品进行标注以方便用户进行搜索。但“一图胜千言”,传统的基于人工标注的方法不但费时费力,又难做到准确完整。如果在网站中设置图片分类过滤器,无疑能方便用户进行浏览。基于视觉信息的图像自动分类技术能够方便商家和用户,如进行商品自动标注和辅助图像检索。
基于视觉信息的图像自动分类是是根据图像的视觉特征对图像进行自动语义分类,需要克服类内差异、遮挡、姿态变化和背景干扰对分类带来的不利影响,目前是计算机视觉领域最具挑战的课题之一。针对商品图像分类,B.Tomasik等(Tagging products using image classification,in Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval.2009,ACM:Boston,MA,USA.)探讨了运用图像分类进行图像标注的方法,在2-3类商品图像上取得了66%-96%的准确率。Oren Boiman等(In Defense of Nearest-Neighbor Based Image Classification,Proceedings of IEEE Conference on Computer Vision and Pattern Recognition)提出了一种朴素贝叶斯最近邻的分类器NBNN,(Naive-Bayes Nearest-Neighbor),在图像局部特征空间采用最近邻方法,计算图像-类之间的距离,并且证明了在基于贝叶斯假设下,这种分类器可以近似理论上最优的图像分类器。但由于这种方式基于穷尽搜索,当标记图像数目比较多、类别数比较大时,运行时间就会变得越来越大,很难达到实际应用的要求。本发明在此基础上提出了基于局部特征聚类及朴素贝叶斯分类器的商品图像分类算法。首先在图像局部特征空间进行分级层次聚类,形成若干个分级聚类中心,在计算图像-类距离时,首先计算图像和每类各个分级聚类中心之间的距离,找出每类最近邻的聚类中心。在此聚类包含的所有描述子中计算图像各描述子的最近邻,将图像各描述子与其对应最近邻描述子的距离进行相加,得到的距离之和即为图像-类之间的距离。测试图像的类别即为最小距离所对应的类别。
本发明可在保证较高正确率的情况下有效提高计算速度,适用于较大规模的商品图像分类。
发明内容
本发明要解决的技术问题是基于视觉特征的商品图像自动分类,提供了一种基于视觉信息的商品图像自动分类方法,这种方法提取图像局部特征,采用分级聚类和图像-类距离计算的方法实现类别识别。
本发明的技术方案如下:
步骤一.取已分好类的商品图像作为分类器标记样本;
步骤二.以稠密采样方式提取并描述各标记图像类的局部图像特征(如:SIFT)。
步骤三.将各类内训练图片提取的局部特征进行层次聚类,形成若干个分级聚类中心,并标记隶属于每个聚类中心的图像块描述子;
步骤四.以稠密采样方式提取并描述测试图片局部特征(SIFT);
步骤六.依次计算测试图像每个图像块到各类各分级聚类中心的L2距离,找出每个测试图像块与每个标记类距离和最小的聚类中心;
步骤七.在相应最近邻聚类中,依次计算各图像局部特征块的最近邻描述子,并计算对应L2距离;
步骤八.对应L2距离和最小的类别即为分类结果。
本发明的效果和益处能够根据商品图像的视觉内容实现商品自动分类;采用每类图像局部特征描述子分级层次聚类的方法,大大减少了图像-类距离计算中的穷尽搜素问题,大大提高了计算效率。在计算图像块之间距离时,充分考虑特征所在位置信息,能够提高分类效果。
附图说明
附图1是本发明算法基本过程示意框图。
附图2是本发明算法训练和测试过程流程图。
附图3是图像-类距离计算方法示意图。
附图4是本发明实施例中的部分图库示意图。
具体实施方式
如图1所示,具体描述如下步骤如下:
步骤一.获取取已知类别的商品图像样本,每类10~50个样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110340761.8/2.html,转载请声明来源钻瓜专利网。