[发明专利]一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法有效

申请号：	201911375406.7	申请日：	2019-12-27
公开（公告）号：	CN111178427B	公开（公告）日：	2022-07-26
发明（设计）人：	郭春生;容培盛;陈华华;应娜	申请（专利权）人：	杭州电子科技大学
主分类号：	G06V10/762	分类号：	G06V10/762;G06V10/77;G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	浙江千克知识产权代理有限公司 33246	代理人：	周希良
地址：	310018 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 sliced wasserstein 距离深度编码进行图像嵌入方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法，其特征在于，包括步骤：

S1.构建基于Sliced-Wasserstein距离的自编码网络模块；本步骤中构建的自编码网络模块由编码器f(x；θ_f)和解码器g(z；θ_g)组成；

原始图像经过网络的编码器，在指定的特征空间中提取图像的低维特征向量z，再经过网络的解码器，得到重构的新图像；设数据x₁,x₂,...,x_N∈X是原始图像的输入，z是自编码网络中编码器f(x；θ_f)输出的特征向量，而x′_n是解码器g(z；θ_g)的输出重构图像，为了使网络重构后的图像保留更多原始图像的特征信息，利用均方损失、L1范数损失以及Sliced-Wasserstein的近似距离来约束网络的重构和映射至潜在特征空间的性能，即

其中，μ表示输入数据的分布；η表示自编码网络重构后的数据分布，p_z表示数据在指定特征空间中编码后的分布；q_z表示预先定义的采样分布；λ表示一个超参数，用于鉴定损失函数的相对重要性；

设S^d-1是概率空间Ω^d中的单位球，对于一个向量v_n∈S^d-1，其中v_n＝{v₁,...,v_N}代表选取的N个切片单元，(∏_v)_#η表示η的投影分布，Γ(η，μ)表示的是η和μ组合起来的所有可能联合分布的集合，自编码器模块的最终优化约束条件为：

S2.构建聚类模块，包括构建聚类模块中的软分配、KL损失优化、软聚类损失优化；

构建聚类模块中的软分配：

假设质心为ρ₁,ρ₂,...,ρ_K，使用t分布作为核函数来测量嵌入点z_i和质心ρ_j之间的相似性，具体为：

其中，ρ_j表示质心；z_i表示嵌入点；z_i＝f_θ(x_i)∈Z对应于数据点x_i∈X嵌入后的特征向量；Z表示数据提取特征后的低维空间；X表示数据的原始空间；α表示t分布的自由度；q_ij表示将样本i分配给聚类质心ρ_j的概率；自由度α＝1；

构建聚类模块中的KL损失优化：

在辅助目标分布的帮助下，模型通过将软分配与辅助分布相匹配来进行训练；为此，将目标函数定义为软分配分布q_i和辅助分布p_i之间的KL-divergence损失：

通过将q_i提升到第二个幂然后按每个簇的频率进行归一化来定义辅助目标函数p_i：

其中，f_j＝∑_iq_ij表示软集群频率；q_ij通过嵌入式聚类网络由式(7)计算得到；通过对原始分布求平方并对其进行归一化，辅助分布p_ij强制赋值具有更严格的概率，即更接近0和1；

构建聚类模块中的软聚类损失优化：

软聚类需要最小化损失函数

其中，E_wkm表示软聚类最小损失；需要满足条件φ_i(k)＞0；在神经网络的训练中，质心根据网络的迭代训练过程进行更新优化，对于软分配的计算，将公式设置为φ_i(k)＝q_ij；

S3.将所述构建的自编码网络模块和聚类模块进行联合，构建基于Sliced-Wasserstein距离的自编码嵌入式聚类网络；本步骤具体为：将构建的自编码网络模块和构建的聚类模块中的软分配、KL损失优化、软聚类损失优化进行联合到最终的网络中；结合式(6)和式(8)、式(10)，得到最终的整个网络的损失函数为：

其中，α，β，γ表示超参数，用于协调网络各部分之间的权重；

S4.初始化构建后的自编码嵌入式聚类网络的聚类中心，将无标签的数据集输入到网络进行迭代训练，并对自编码嵌入式聚类网络进行处理，当所述处理后的自编码嵌入式聚类网络达到预设阈值时，完成最终的聚类；本步骤具体为：搭建完嵌入式聚类网络的整体模块后，首先初始化网络的聚类中心，再将无标签的数据集输入到网络进行迭代的训练，微调超参数α，β，γ，网络根据最终的网络损失函数(11)自动优化嵌入式聚类网络，当达到迭代次数时，终止训练，从而完成最终聚类。

2.根据权利要求1所述的一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法，其特征在于，步骤S4中，初始化构建后的自编码嵌入式聚类网络的聚类中心采用Xavier Uniform方法初始化。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911375406.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于BIM的机电管线综合规范自动化检查系统
下一篇：一种加药装置出厂测试平台及使用方法

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法有效

专利文献下载