[发明专利]一种多视角深度生成图像聚类方法在审
申请号: | 202011343290.1 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112464004A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 陈志奎;高静;张佳宁;李朋;金珊;宋鑫 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视角 深度 生成 图像 方法 | ||
1.一种多视角深度生成图像聚类方法,其特征在于,包括以下步骤:
步骤1、预训练各视角独立的编解码网络;
1.1训练单一视角单个自动编码机
假设xvi为第v个视角的第一个自动编码机的第i个输入图像数据,yvi为第v个视角的第一个自动编码机的第i个输出图像数据,该自动编码机具体计算过程如下:
hvi(1)=ge,v(1)(We,v(1)xvi+be,v(1)) (1)
yvi=gd,v(1)(Wd,v(1)hvi(1)+bd,v(1)) (2)
其中,hvi(1)是该自动编码机的中间结果即隐藏层特征,维度小于输入图像数据,ge,v(1)和gd,v(1)分别是其编码层和解码层的激活函数,θv(1)={We,v(1),be,v(1),Wd,v(1),bd,v(1)}是该自动编码机网络的所有参数;
该自动编码机通过最小化重构损失训练;第一个自动编码机训练完成后,第二个自动编码机采用第一个自动编码机隐藏层特征hvi(1)作为输入图像数据,仿照公式(1)、(2)训练,第三个自动编码机直到第n个自动编码机同理,n为堆叠自动编码机中编码器的层数;
1.2训练单一视角多个自动编码机
第v个视角的第一个自动编码机训练完成后,该视角的第二个自动编码机采用第一个自动编码机隐藏层特征hvi(1)作为输入图像数据训练;
此时,hvi(1)为第v个视角的第二个自动编码机的第i个输入图像数据,设hovi(1)为其第i个输出图像数据,该自动编码机具体计算过程如下:
hvi(2)=ge,v(2)(We,v(2)hvi(1)+be,v(2)) (3)
hovi(1)=gd,v(2)(Wd,v(2)hvi(2)+bd,v(2)) (4)
其中,同样地,hvi(2)是该自动编码机的中间结果即隐藏层特征,维度小于输入图像数据,ge,v(2)和gd,v(2)分别是其编码层和解码层的激活函数,θv(2)={We,v(2),be,v(2),Wd,v(2),bd,v(2)}是该自动编码机网络的所有参数;该自动编码机通过最小化重构损失训练;第三个自动编码机直到第n个自动编码机同理,n为堆叠自动编码机中编码器的层数;
1.3训练多个视角堆叠自动编码机
在各个自动编码机训练完成后,每个自动编码机被拆分为编码层和解码层两部分,以第n个自动编码机的隐藏层为对称轴对称排布和衔接;整体对称排布的网络接收最外侧自动编码机输入图像数据,逐层传递,得到最外侧自动编码机输出图像数据;各个视角均依照上述方法独立构建自己的堆叠自动编码机网络,得到各个视角独立的潜在特征空间;
步骤2、预训练多视角特征融合编解码网络;
将对应同一对象的各个视角提取的深度特征进行拼接,计算过程如下:
H=con(H1,H2,...,Hn) (5)
其中,H1、H2……Hn表示各个视角的深度特征,con()表示拼接运算,H表示拼接后的特征;
再次采用堆叠自动编码机网络,通过最小化重构损失,学习拼接特征的低维融合信息;
步骤3、随机初始化高斯混合模型参数;
高斯混合模型设定K个子高斯分布,并给予对应的总和为1的非负权重wk,N个样本点中,xi的概率由K个子高斯分布的概率加权得到,如下所示:
其中,g()表示高斯分布的概率密度函数,被对应的均值向量μk和协方差矩阵Σk两个参数所定义,具体计算过程如下:
其中,d表示样本点xi和均值向量μk的维度;
采用随机的方法初始化K个子高斯分布对应的非负权重wk、均值向量μk和协方差矩阵Σk;
步骤4、计算图像聚类结果;
将同一对象多个视角图像的融合特征作为图像聚类的样本点xi,输入到高斯混合模型,以计算图像聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343290.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于纳米裂纹的地震动传感器的制造方法
- 下一篇:一种深度强化图像聚类方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序