[发明专利]一种多视角深度生成图像聚类方法在审
申请号: | 202011343290.1 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112464004A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 陈志奎;高静;张佳宁;李朋;金珊;宋鑫 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视角 深度 生成 图像 方法 | ||
本发明公开了一种多视角深度生成图像聚类方法,属于图像聚类与数据挖掘技术领域,1)预训练各视角独立的编解码网络,发现各视角潜在特征空间;2)预训练多视角特征融合编解码网络,发现多视角融合特征空间;3)随机初始化高斯混合模型参数;4)计算数据样本由某一子高斯模型生成的概率作为图像聚类结果,生成聚类损失,计算高斯混合模型参数更新值,更新参数直到收敛。本发明针对图像数据设计了一种多视角深度生成图像聚类方法,主要考虑利用多视角图像数据中的互补信息优化特征的学习,提高图像聚类和特征学习效果,并为此设计一种多视角特征融合策略,端到端地融合多个视角中的数据信息,该策略可以有效提高多视角数据信息的利用率,提高图像聚类算法性能。
技术领域
本发明属于图像聚类与数据挖掘技术领域,涉及一种多视角深度生成图像聚类方法。
背景技术
全球信息化发展迅速,人类正在跨入大数据时代。互联网上信息的数据量每天都在以几何倍数迅猛增长,比如:互联网上的多媒体数据(图像、语音、视频等)、机器人终端接收的实时数据、物联网设备传感器的数据等,这些数据的数据量较大,产生速度较快,数据分布不均匀,且数据内部的信息质量也不是很高。面对大数据带来的挑战,从多样分布的低质数据中快速分析并找到数据潜在的关系结构与语义特征成为当下的迫切需求。因此,需要对数据处理的算法和模型进行深入的研究,改进传统的数据处理方法。
聚类是数据挖掘研究中的一种重要技术,能够将空间中的数据对象分成若干类,使得相同类数据之间的相似度较高,不同类数据之间的相似度较低,以发现数据内含的模式,利于海量数据的学习和利用。随着人工智能的兴起,深度学习、机器学习、数据挖掘的发展推动着聚类分析研究的进步,使得它成为数据分析中的重要工具。然而,随着现代互联网技术的迅速发展,数据规模不断增大、维度逐渐升高、关系愈发复杂。低维数据空间中的传统聚类方法面对海量的高维数据,往往很难达到预期效果。为了解决以上难点,研究者提出了两种有效方案。一是对高维数据进行降维,如主成分分析(PCA)等,使降维后的数据适合一般的聚类算法;二是对聚类算法进行改进,使其适合高维数据。然而,传统的聚类算法的浅层结构难以获得足够的特征信息。因此,通过深度神经网络(DNN)提取输入数据的深度特征,提高聚类准确率的深度聚类方法受到广泛关注。
然而,以上方法只使用了图像数据本身的信息,没有考虑图像数据间的先验知识,即数据的多视角特性。由于它们没有考虑数据中不同图像所反映的对象在不同视角中的信息,只是将聚类方法作用于数据的单视角特征,无法利用多个视角间的互补信息优化特征的学习,使得性能局限于单个视角的信息所能支撑的范围之内,导致无法充分利用多视角数据中蕴含的信息。
综上,本发明提出一种多视角深度生成图像聚类方法,主要考虑利用多视角图像数据中的互补信息优化特征的学习,提高图像聚类和特征学习效果。
发明内容
本发明提出一种多视角深度生成图像聚类方法。该方法利用堆叠自动编码机将原始图像数据映射到特定的低维特征空间,避免原始数据空间中的维度灾难,提取数据的深度特征。同时,本发明设计一种多视角特征融合策略,融合多个视角中的数据信息,该策略可以有效提高多视角数据信息的利用率,提高图像聚类算法性能。此外,本发明提出一种端到端的学习框架,该框架集成多视角特征融合与单视角特征提取来共同发现数据的潜在特征空间,获取更为丰富的多视角融合特征,最终提高图像聚类方法的性能,并通过两个聚类评估指标:调整兰德指数(ARI)和标准化互信息(NMI)验证模型效果。
为了达到上述目的,本发明一种多视角深度生成图像聚类方法,包括以下步骤:
步骤1、预训练各视角独立的编解码网络,发现各视角潜在特征空间;
步骤2、预训练多视角特征融合编解码网络,发现多视角融合特征空间;
步骤3、随机初始化高斯混合模型参数;
步骤4、计算数据样本由某一子高斯模型生成的概率作为图像聚类结果,生成聚类损失,计算高斯混合模型参数更新值,更新参数直到收敛;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343290.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于纳米裂纹的地震动传感器的制造方法
- 下一篇:一种深度强化图像聚类方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序