[发明专利]一种深度图像聚类方法、系统、设备、介质及终端在审
申请号: | 202111086097.9 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113971735A | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 胡牛犇;王卫卫;冯象初 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/74;G06V10/762;G06V10/764;G06K9/62 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 何畏 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 图像 方法 系统 设备 介质 终端 | ||
1.一种深度图像聚类方法,其特征在于,所述深度图像聚类方法包括以下步骤:
步骤一,输入一组图片,通过SIMO自编码器中的编码器得到每一副图片的多组编码;
步骤二,将每幅图片的多组编码以及每组编码进行信息融合后的编码分别输入相同的解码器中得到从重构的图片;
步骤三,将重构的图片与对输入图片经过数据增强后得到的图片计算重构损失,进行网络的预训练;
步骤四,待预训练结束后,对融合编码进行聚类得到对比聚类损失加入训练过程中进行联合训练,实现参数优化;
步骤五,联合训练结束后,对整个数据集进行特征提取,得到融合编码输入到传统的聚类算法得到聚类结果。
2.如权利要求1所述的深度图像聚类方法,其特征在于,步骤一中,所述输入一组图片,通过SIMO自编码器中的编码器得到每一副图片的多组编码,包括:
假定一幅图片为苫,大小为W×H×C,其中W、H、C分别指该图片的宽,高和通道,如灰度图片则C=1,彩色图片则C=3;自编码器网络结构一般分两部分,假定第一部分为f(·),则一幅图片经过编码后得到z=f(x);对于SIMO自编码器,每幅图片产生多种编码,即:
z1,z2,...,zm=f(x);
其中,m为可调参数,意为每幅图片生成m组编码;
使用卷积块构建卷积自编码器,其中每一个卷积块由连续的卷积核大小为3×3×cin×Cout,步长为1的卷积层、BN层、leakyReLU激活函数组成,连续的两个卷积块后使用步长为2的最大池化层对featuremap进行降维,连续的堆叠后,假定featuremap的大小为Wl×Hl×Cl,将所述featuremap进行flatten,即featuremap从3维的张量变成1维的向量,此时再将此向量经过不同分支的全连接层得到最终的多组编码。
3.如权利要求1所述的深度图像聚类方法,其特征在于,步骤二中,所述将每幅图片的多组编码以及每组编码进行信息融合后的编码分别输入相同的解码器中得到从重构的图片,包括:
让每一组编码完成属于他们的重构任务,来使得这些编码具有不同的物理意义;对这m组编码做加权平均的信息融合得到Δz,即得到m+1种编码;将所述m+1种编码输入到相同的解码器中,其中解码器基本上与编码器对称,先由全连接层将编码映射回维度大小为Wl×Hl×Cl的向量,再进行reshape操作重新得到三维的featuremap,再经过上采样、卷积的操作最后得到与编码器输入图片大小相等的重构图片,
4.如权利要求1所述的深度图像聚类方法,其特征在于,步骤三中,将重构的图片与对输入图片经过数据增强后得到的图片计算重构损失进行网络的预训练,包括:
得到解码的重构图片后,使用输入图片的数据增强,包括旋转、翻转和随机裁剪图像数据增强操作,得到与编码一一对应的m+1个增强后的图片:
aug1,aug2,...,augm=random_aug(x);
计算解码的重构图片与增强后的图片的重构损失:
其中,l(·,·)为某相似度量函数;第m+1个重构图片是由融合编码Δz得来,故计算与x的重构损失加入到损失函数中进行训练,训练时使用Adam优化器,学习率为0.001,batch_size为512,无学习率衰减策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111086097.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种酮基物制备方法
- 下一篇:一种散热型控温作业胶辊式砻谷机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序