[发明专利]一种融合局部聚合描述符和局部线性编码的图像分类方法有效
申请号: | 201810523705.X | 申请日: | 2018-05-28 |
公开(公告)号: | CN108805183B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 龙显忠;程成 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/764;G06V10/80;G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 杜春秋;姚姣阳 |
地址: | 210033 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 局部 聚合 描述 线性 编码 图像 分类 方法 | ||
1.一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,包括以下步骤:
步骤1、建立包含一组测试图像的数据集,利用视觉显著性检测得到数据集中每张图像的显著区域,并提取每张图像显著区域的局部特征;
步骤2、对步骤1中获得的所有图像的局部特征进行聚类,得到关于局部特征的一个字典,聚类的个数为字典的大小;
步骤3、由步骤2得到的字典对步骤1中每张图像显著区域的局部特征进行重构,并将每张图像得到的重构系数进行累加,得到每张图像的重构系数向量;
步骤4、将步骤1得到的每张图像显著区域的局部特征和步骤2得到的字典采用VLAD算法进行编码,得到每张图像的VLAD编码;
步骤5、将步骤4得到的每张图像的VLAD编码和步骤3得到的每张图像的重构系数向量进行融合,得到每张图像的融合编码;
步骤6、利用分类器对由步骤5得到的测试图像的融合编码进行分类。
2.根据权利要求1所述一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,在步骤1中,采用GBVS算法得到每张图像的显著区域,在显著区域提取128维的局部特征。
3.根据权利要求2所述一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,在步骤2中,采用K-means算法对每张图像显著区域的局部特征进行聚类,得到大小为K的字典B,所述字典的表达式如下:B=[b1,b2,...,bK]∈R128×K,b表示视觉单词。
4.根据权利要求3所述一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,在步骤3中,采用近似LLC算法对提取的每张图像显著区域的局部特征进行重构,得到每张图像提取特征的重构系数,将上述重构系数进行累加,得到每张图像的重构系数向量。
5.根据权利要求4所述一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,在步骤4中,采用VLAD算法对提取的每张图像显著区域的局部特征进行编码,得到每张图像的VLAD编码。
6.根据权利要求5所述一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,在VLAD编码时,先找到提取的局部特征在字典中的最近邻视觉单词,然后在局部特征及其最接近的视觉单词之间累积残差向量,对于每张图像得到一个K*128维的向量。
7.根据权利要求6所述一种融合局部聚合描述符和局部线性编码的图像分类方法,其特征在于,在步骤5中,对得到的VLAD描述符和近似LLC的重构系数的累加和向量进行融合,融合VLAD编码和近似LLC时,将得到的K维累加系数中的每一维放在原始VLAD编码的每128维的下一维,得到最终的K*(128+1)维来表示每张图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810523705.X/1.html,转载请声明来源钻瓜专利网。