[发明专利]一种标记与语义自编码融合的零样本图像分类方法在审
申请号: | 202010501150.6 | 申请日: | 2020-06-04 |
公开(公告)号: | CN111914872A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 蔺广逢;范引娣;缪亚林;陈万军;张二虎 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 韩玙 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标记 语义 编码 融合 样本 图像 分类 方法 | ||
1.一种标记与语义自编码融合的零样本图像分类方法,其特征在于,具体按照以下步骤实施:
步骤1、图像到语义的自编码映射求解,获得图像到语义的映射矩阵;
步骤2、图像到标记的自编码映射求解,获得图像到标记的映射矩阵;
步骤3、根据图像到语义的映射矩阵、图像到标记的映射矩阵求解图像标记融合系数;
步骤4、根据图像标记融合系数对零样本图像标记估计,根据估计结果进行分类标记。
2.根据权利要求1所述一种标记与语义自编码融合的零样本图像分类方法,其特征在于,步骤1具体过程为:
步骤1.1、取n个图像样本,对n个图像样本提取可见类别的图像特征矩阵和可见类别的语义嵌入特征矩阵
步骤1.2、根据单层的线性自编码器原理可得:
其中,d1为图像特征维度,d2为语义嵌入特征维度,λ1为折中参数取为1,为图像到语义的映射矩阵;
步骤1.3、根据式(1)进而可得:
BA1+A1C=D (2)
其中,B=SST,C=λ1XXT,D=(1+λ1)SXT,通过matlab中的函数sylvester优化求解图像到语义的映射矩阵A1。
3.根据权利要求2所述一种标记与语义自编码融合的零样本图像分类方法,其特征在于,步骤2具体过程为:
步骤2.1、对n个图像样本提取可见类别的标记矩阵
步骤2.2、根据单层的线性自编码器原理可得:
其中,d3为标记维度,λ2为折中参数取10,为图像到标记的映射矩阵;
步骤2.3、根据式(3)进而可得:
EA2+A2F=G (4)
其中,E=YYT,F=λ2XXT,G=(1+λ2)YXT,通过matlab中的函数sylvester优化求解图像到标记的映射矩阵A2。
4.根据权利要求3所述一种标记与语义自编码融合的零样本图像分类方法,其特征在于,步骤3具体过程为:
步骤3.1、根据最小平方误差原理进行图像标记融合,可得:
其中,β1+β2=1,β1>0,β2>0,β=[β1β2]为图像标记融合系数,是计算矩阵和矩阵各列向量成对相似度量形成矩阵,成对相似度量通过余弦距离计算,d3为可见类别数目,Ws为可见类别成对语义特征相似矩阵,成对语义特征相似通过余弦距离计算;
步骤3.2、根据式(5)可得:
其中,通过多元线性回归求解图像标记融合系数β=[β1 β2]。
5.根据权利要求4所述一种标记与语义自编码融合的零样本图像分类方法,其特征在于,步骤4具体过程为:
根据语义特征映射与标记映射迁移融合原理得零样本图像标记估计:
其中,为预测的标记矩阵表示着未可见类别的标记结构;为未可见类别的图像特征矩阵,m为未可见样本的数目;是计算矩阵和矩阵各列向量成对相似度量形成矩阵,d4为未可见类别数目;Wu为可见类别成对语义特征相似矩阵;Wsu为可见类别和未可见类别成对语义特征相似矩阵;
取为中任一元素,估计未可见类的样本的分类标记为:
其中,m为未可见样本的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010501150.6/1.html,转载请声明来源钻瓜专利网。