[发明专利]基于空间金字塔稀疏编码的自然场景多标记分类方法有效
申请号: | 201510512625.0 | 申请日: | 2015-08-19 |
公开(公告)号: | CN105069481B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 焦李成;张丹;马文萍;屈嵘;曾杰;刘红英;王爽;侯彪;杨淑媛;尚荣华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明方法公开了一种基于空间金字塔稀疏编码的自然场景多标记分类方法,主要解决现有分类方法对自然场景描述不够完全和分类正确率较低的问题。其实现步骤是:建立自然场景图像多标记类别库;提取它的尺度不变特征SIFT生成稀疏字典D;用稀疏字典对图像进行字典映射,并用空间金字塔和稀疏编码生成多尺度稀疏向量;用多分类支持矢量机分类结果校正排序支持矢量机分类结果,得到自然场景图像的最终分类结果。本发明采用了多尺度特征、稀疏编码和多标记分类方法,提取了图像的局部信息,丰富了图像的特征信息,对自然场景描述的更为完全,提高了自然场景的分类精度和鲁棒性,可用于自然场景匹配、分类和识别。 | ||
搜索关键词: | 自然场景 分类 稀疏编码 多标记 分类结果 金字塔 字典 自然场景图像 支持矢量机 图像 稀疏 多尺度特征 局部信息 特征信息 稀疏向量 多尺度 类别库 鲁棒性 正确率 可用 映射 校正 排序 匹配 并用 尺度 | ||
【主权项】:
1.一种基于空间金字塔稀疏编码的自然场景多标记分类方法,包括如下步骤:(1)建立自然场景图像多标记类别库;(2)对自然场景图像多标记类别库中的每幅图像,提取图像的尺度不变SIFT特征矩阵F:以k像素为步长均匀采样,并提取每个采样点周围16×16像素大小图像块的d维尺度不变特征SIFT,得到图像的SIFT特征矩阵F={y1 ,y2 ,...,yi ,...,yn }∈Rd×n ,其中R表示实数集合,yi 表示图像的第i个图像块的SIFT特征向量,i=1,2,...,n,n表示图像中图像块的个数,d表示SIFT特征维数;(3)对所有图像的SIFT特征矩阵,从中随机选取M个特征向量,构成新特征矩阵Y,将其通过K-奇异值分解方法K-SVD训练字典D,M取值为100000-1000000之间的整数;(4)对每幅图像的特征矩阵F,通过已经训练好的字典D进行稀疏编码,得到图像的稀疏矩阵W;(5)对每幅图像的稀疏矩阵W,利用空间金字塔最大池化方法,得到图像的稀疏编码向量X;(6)将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持矢量机Rank-SVM进行分类,通过多分类支持矢量机SVM的分类结果为S,通过排序支持矢量机Rank-SVM的分类结果为R:(6a)把图像的稀疏编码向量X输入到多分类支持矢量机SVM中,通过一对多的正项准则策略,经过训练、测试,得到图像的分类结果S={S1 ,S2 ,...,Si ,...,Sm },其中Si 表示在该分类策略中第i幅图像的分类结果,m表示测试图像的总数;(6b)把图像的稀疏编码向量X输入到排序支持矢量机Rank-SVM中,经过训练、测试,得到图像的分类结果R={R1 ,R2 ,...,Ri ,...,Rm },其中Ri 表示在该分类策略中第i幅图像的分类结果;(7)通过多分类支持矢量机SVM的分类结果S辅助校正排序支持矢量机Rank-SVM的分类结果R,得到自然场景图像多标记类别库中图像的最终分类结果C:多分类SVM的分类结果S={S1 ,S2 ,...,Si ,...,Sm }中找到非零向量的位置为j,j=1,2,..m,用位置为j的非零向量Sj 替换Rank-SVM的分类结果R={R1 ,R2 ,...,Ri ,...,Rm }中对应位置j的向量Rj ,得到自然场景图像多标记类别库中图像的最终分类结果C={R1 ,R2 ,...,Sj ,...,Rm },其中Sj 为替换向量Rj 的非零向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510512625.0/,转载请声明来源钻瓜专利网。