[发明专利]基于空间金字塔稀疏编码的自然场景多标记分类方法有效
申请号: | 201510512625.0 | 申请日: | 2015-08-19 |
公开(公告)号: | CN105069481B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 焦李成;张丹;马文萍;屈嵘;曾杰;刘红英;王爽;侯彪;杨淑媛;尚荣华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然场景 分类 稀疏编码 多标记 分类结果 金字塔 字典 自然场景图像 支持矢量机 图像 稀疏 多尺度特征 局部信息 特征信息 稀疏向量 多尺度 类别库 鲁棒性 正确率 可用 映射 校正 排序 匹配 并用 尺度 | ||
1.一种基于空间金字塔稀疏编码的自然场景多标记分类方法,包括如下步骤:
(1)建立自然场景图像多标记类别库;
(2)对自然场景图像多标记类别库中的每幅图像,提取图像的尺度不变SIFT特征矩阵F:
以k像素为步长均匀采样,并提取每个采样点周围16×16像素大小图像块的d维尺度不变特征SIFT,得到图像的SIFT特征矩阵F={y
(3)对所有图像的SIFT特征矩阵,从中随机选取M个特征向量,构成新特征矩阵Y,将其通过K-奇异值分解方法K-SVD训练字典D,M取值为100000-1000000之间的整数;
(4)对每幅图像的特征矩阵F,通过已经训练好的字典D进行稀疏编码,得到图像的稀疏矩阵W;
(5)对每幅图像的稀疏矩阵W,利用空间金字塔最大池化方法,得到图像的稀疏编码向量X;
(6)将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持矢量机Rank-SVM进行分类,通过多分类支持矢量机SVM的分类结果为S,通过排序支持矢量机Rank-SVM的分类结果为R:
(6a)把图像的稀疏编码向量X输入到多分类支持矢量机SVM中,通过一对多的正项准则策略,经过训练、测试,得到图像的分类结果S={S
(6b)把图像的稀疏编码向量X输入到排序支持矢量机Rank-SVM中,经过训练、测试,得到图像的分类结果R={R
(7)通过多分类支持矢量机SVM的分类结果S辅助校正排序支持矢量机Rank-SVM的分类结果R,得到自然场景图像多标记类别库中图像的最终分类结果C:
多分类SVM的分类结果S={S
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510512625.0/1.html,转载请声明来源钻瓜专利网。