[发明专利]一种基于无监督特征学习的图像分类方法在审

申请号：	202010173425.8	申请日：	2020-03-12
公开（公告）号：	CN111401434A	公开（公告）日：	2020-07-10
发明（设计）人：	聂飞平;陆继韬;王榕;李学龙	申请（专利权）人：	西北工业大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/34
代理公司：	西北工业大学专利中心 61204	代理人：	常威威
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于监督特征学习图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于无监督特征学习的图像分类方法，其特征在于步骤如下：

步骤1：对于原始第i幅输入图像，i＝1,2,…,N，N为输入图像的数量，按照以下过程提取得到其降维后特征图集合其中，表示原始第i幅输入图像的第j幅降维后的特征图，j＝1,2,…,D₁，D₁为设定的目标维度：

步骤1.1：以步长为1的滑动窗口提取图像中以每个像素为中心的图像块，然后，将每个图像块拉伸为一维向量，并分别对每个向量进行去均值化处理，以每个去均值化后的向量作为矩阵的一列，得到矩阵X；其中，设输入图像的大小为p×p，所述的图像块的大小为k×k，k的取值范围为1＜k＜p；

步骤1.2：采用主成分分析算法求解一组标准正交基构成的正交矩阵V，满足：

其中，L₁为设定的滤波器个数，取值范围为1≤L₁＜k²；

将矩阵V的每一列由向量变换为k×k大小的矩阵，以变换得到的每个矩阵为一个滤波器，再将每个滤波器分别与原始输入图像做卷积运算，且通过补零操作使卷积后得到的特征图与原始图像大小相同，得到L₁幅大小为p×p的特征图；

步骤1.3：将步骤1.2输出的每幅特征图拉伸为一个一维向量，并以其作为矩阵的一行，得到原始特征图矩阵再采用主成分分析算法求解一组标准正交基构成的投影矩阵U₁，满足：

其中，D₁为设定的目标维度，取值范围为1≤D₁≤L₁；

按照计算得到降维后矩阵P，将P的每一个行向量变换为p×p大小的矩阵，每个矩阵即为一幅降维后的特征图，共得到D₁幅降维后的特征图，构成原始输入图像降维后的特征图集合；

步骤2：对于步骤1得到的每一个降维后特征图集合以其中的每一幅图像为输入图像，j＝1,2,…,D₁，并令步骤1.2中所述的滤波器个数为L₂，取值范围为1≤L₂＜k²，步骤1.3中所述的目标维度为D₂，取值范围为1≤D₂≤L₂，按照步骤1计算得到第二次降维后特征图集合

步骤3：对于步骤2得到的每一个特征图集合将其中的所有图像都进行二值化处理，使图像中所有的像素值为0或1，然后，提取不同图像中同一位置的所有像素点值构成一个长度为D₂的二进制串，对所有位置的像素点都如此进行提取，再将每一个二进制串转换为一个十进制数，并以每个十进制数作为其对应的二进制串所提取像素位置的新的像素值，得到一幅新图像，记为

至此，对于原始第i幅输入图像，得到一个新图像集合

步骤4：对于步骤3得到原始第i幅输入图像的新图像集合Γ_i，i＝1,2,…,N，将其中的每一幅图像以步长为s、大小为b×b的滑动窗口进行区块提取，其中，1≤b≤p，1≤s≤b，然后，分别在每个区块中统计含有个bin的直方图，再将所有直方图连接成一个向量；将集合中所有图像按前述过程得到的向量相连接，并以连接后的向量作为原始第i幅输入图像的特征嵌入；

对原始每一幅输入图像的新图像集合Γ_i，i＝1,2,…,N，都按照上述过程进行处理，得到其对应的特征嵌入，得到全部原始N幅输入图像的N个特征嵌入；

步骤5：以步骤4得到的N个特征嵌入作为分类器的输入数据，原始N幅输入图像的标签作为分类器的输入标签，对分类器进行训练，得到训练好的分类器；所述的分类器包括最邻近分类器、支持向量机；

步骤6：以未标记的待分类M幅图像为输入图像，按照步骤1-4计算得到其M个特征嵌入，再将这M个特征嵌入输入到步骤5得到的训练好的分类器，得到分类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010173425.8/1.html，转载请声明来源钻瓜专利网。

上一篇：应用于显示设备的内容展示方法、装置和电子设备
下一篇：一种吊顶定位装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于无监督特征学习的图像分类方法在审

专利文献下载