[发明专利]基于迁移学习的高斯混合模型数据聚类方法在审
申请号: | 201911130984.4 | 申请日: | 2019-11-18 |
公开(公告)号: | CN110956204A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 周劲;王荣荣;韩士元;王琳;陈月辉 | 申请(专利权)人: | 济南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 支文彬 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 迁移 学习 混合 模型 数据 方法 | ||
1.一种基于迁移学习的高斯混合模型数据聚类方法,其特征在于,包括如下步骤:
a)计算机读入需要进行聚类的数据,将读入的数据组成的集合标记为目标域T,计算机分析目标域T中数据的个数N以及数据的维度D;
b)计算机读入一个数据类型与目标域T相同的数据集合,将数据集合标记为源域S,源域S中的数据的维度与目标域T的数据维度D相同;
c)使用GMM聚类算法对源域S的数据进行聚类,用户输入GMM算法中的组件的个数KS,用户选择参数初始化方法将GMM算法中的正则化系数γ设置为0.01,将GMM算法中的停止阈值δ设置为10-6;
d)计算机记录GMM算法中对源域S的数据聚类结果,得到源域S的类均值,用表示为源域S中第k个组件的类均值,k=1,2,...,KS,得到源域S的类协方差矩阵,用表示源域S中第k个组件的类协方差均值,k=1,2,...,KS;
e)计算机使用源域S中的类均值与类协方差均值采用基于迁移学习的GMM聚类算法对目标域T中的数据进行聚类;
f)根据基于迁移学习的GMM聚类算法得到目标域T中的每个数据点的后验概率,用其后验概率的最大值所在的组件作为该数据点的类标签,从而得到目标域T中的数据聚类结果。
2.根据权利要求1所述的基于迁移学习的高斯混合模型数据聚类方法,其特征在于:步骤c)中的参数初始化方法为随机初始化、K-means初始化与C均值初始化。
3.根据权利要求1所述的基于迁移学习的高斯混合模型数据聚类方法,其特征在于,步骤e)中基于迁移学习的GMM聚类算法包括如下步骤:
e-1)将基于迁移学习的GMM聚类算法中的组件个数KT设置为KT=KS,用户输入基于迁移学习的GMM算法中的学习率λ,0.1≤λ≤5,将基于迁移学习的GMM算法中的迭代计数器t设置为t=0;
e-2)通过用户选择的初始化方法得到目标域T中每一个数据点的初始类标签,记第k个组件所含数据点的个数为Nk,通过公式计算得到初始化基于迁移学习的GMM聚类算法中的混合比例πk,通过公式对每一类数据计算类均值μk,通过公式计算协方差矩阵Σk,完成对基于迁移学习的GMM聚类算法参数的初始化,式中xi为目标域T中的第i个数据点,k=1,2,...,KT;
e-3)通过t+1使基于迁移学习的高斯混合模型聚类算法的迭代计数器t加1;
e-4)通过公式计算目标域T中第i个数据点xi属于第k个组件的后验概率γki,式中其为目标域T中第i个数据点xi属于第k个组件的概率分布,πk为第k个组件的混合比例,i=1,2,...,N,k=1,2,...,KT;
e-5)通过公式计算更新目标域T中的第k个组件的混合比例πk,式中k=1,2,...,KT;
e-6)通过公式计算更新目标域T中的第k个组件的类均值μk,式中k=1,2,...,KT;
e-7)通过公式计算更新目标域T中的第k个组件的协方差矩阵Σk,式中k=1,2,...,KT;
e-8)通过公式
计算第t次迭代得到的目标函数J(t);
e-9)计算基于迁移学习的GMM聚类算法第t次迭代得到的目标函数J(t)与第t-1次迭代得到的目标函数J(t-1)之差,若||J(t)-J(t-1)||≥δ,则返回执行步骤e-3),如果||J(t)-J(t-1)||<δ,则执行步骤f)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911130984.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高效蒸汽压缩式热泵
- 下一篇:一种旅游公厕粪便无害化处理的方法