[发明专利]一种模态有缺失数据的图像分类方法有效
申请号: | 202110095029.2 | 申请日: | 2021-01-25 |
公开(公告)号: | CN112784902B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 彭玺;林义杰;杨谋星;李云帆 | 申请(专利权)人: | 四川大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/762;G06N3/0464;G06N3/084;G06V10/82 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 杨浩林 |
地址: | 610064 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模态有 缺失 数据 图像 分类 方法 | ||
1.一种模态有缺失数据的图像分类方法,其特征在于,包括以下步骤:
S1、将同时存在两个模态的图像样本的两个模态数据分别送入对应的自编码器中,得到对应的隐表示;其中两个模态为HOG和PHOG中的一个,以及GIST;
S2、根据两个模态数据对应的隐表示分别获取对应的跨模态对比学习损失和模态内重构损失;
S3、根据跨模态对比学习损失和模态内重构损失对当前自编码器进行反向传播更新当前自编码器的参数和权重;
S4、判断反向传播次数是否到达阈值,若是则进入步骤S5,否则返回步骤S1;
S5、根据两个模态数据对应的当前最新的隐表示获取对应的跨模态对比学习损失、模态内重构损失和跨模态对偶预测损失;
S6、根据当前最新的跨模态对比学习损失、跨模态对偶预测损失和模态内重构损失对当前自编码器进行反向传播更新当前自编码器的参数和权重;
S7、判断当前自编码器是否收敛,若是则进入步骤S8,否则返回步骤S5;
S8、将同时存在两个模态的图像样本、仅存在第一个模态的图像样本和仅存在第二个模态的图像样本的集合作为有缺失数据的两模态数据集送入当前最新的自编码器,得到有缺失数据的两模态数据集对应的隐表示;
S9、基于对偶映射获取两模态数据集中分别与仅存在第一个模态的图像样本集合对应的隐表示所对应的缺失模态的表示和仅存在第二个模态的图像样本集合对应的隐表示所对应的缺失模态的表示;
S10、将每个图像样本对应的不同模态表示进行拼接并作为其公共表示,对公共表示进行聚类,完成有缺失数据的两模态聚类,即实现模态有缺失数据的图像分类。
2.根据权利要求1所述的模态有缺失数据的图像分类方法,其特征在于,步骤S1中自编码器包括编码器和解码器,编码器包括依次连接的第一全连接层、第一批归一化层、第一激活函数、第二全连接层、第二批归一化层、第二激活函数、第三全连接层、第三批归一化层、第三激活函数、第四全连接层和第四激活函数;第一全连接层的输入维度为输入的模态数据的维度;第一全连接层、第二全连接层和第三全连接层的输出维度均为1024;第一激活函数、第二激活函数和第三激活函数均为ReLU;第四全连接层的输出维度为128,第四激活函数为Softmax;
解码器包括依次连接的第五全连接层、第四批归一化层、第五激活函数、第六全连接层、第五批归一化层、第六激活函数、第七全连接层、第六批归一化层、第七激活函数、第八全连接层、第七批归一化层和第八激活函数;第五全连接层的输入维度为128,第五全连接层、第六全连接层和第七全连接层的输出维度均为1024,第五激活函数、第六激活函数、第七激活函数和第八激活函数均为ReLU;第八全连接层的输出维度为输入的模态数据的维度。
3.根据权利要求1所述的模态有缺失数据的图像分类方法,其特征在于,步骤S2中根据两个模态数据对应的隐表示获取对应的跨模态对比学习损失的具体方法为:
根据公式:
获取跨模态对比学习损失;其中
4.根据权利要求1所述的模态有缺失数据的图像分类方法,其特征在于,步骤S2中根据两个模态数据对应的隐表示获取对应的模态内重构损失的具体方法为:
根据公式:
获取模态内重构损失;其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110095029.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:病毒性脑膜炎辅助诊断分子标记物及其应用和试剂盒
- 下一篇:一种可穿戴超声刀
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序