[发明专利]一种缺失条件下的高斯混合模型聚类机器学习方法在审
申请号: | 202110204941.7 | 申请日: | 2021-02-24 |
公开(公告)号: | CN113076970A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 朱信忠;徐慧英;张毅;刘新旺;赵建民 | 申请(专利权)人: | 浙江师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 赵芳 |
地址: | 321004 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 缺失 条件下 混合 模型 机器 学习方法 | ||
本发明公开了一种缺失条件下的高斯混合模型聚类机器学习方法,包括:S11.获取聚类任务和目标数据样本;S12.将获取的目标数据样本中的每个样本分为可观测特征部分和缺失特征部分,对缺失特征部分进行初始填充并保持可观测特征部分的不变性;S13.利用随机初始化选定各个高斯混合模型成分的代表点,通过极大似然估计方法建立缺失特征部分条件下的高斯混合模型聚类的优化目标函数;S14.采用极大似然估计方法求解建立的高斯混合模型聚类的优化目标函数,实现聚类。本发明将填充任务与高斯混合模型聚类相融合,在聚类结果的引导下填充缺失值,用动态填充的值再进行高斯混合模型聚类。
技术领域
本发明涉及计算机视觉和模式识别技术领域,尤其涉及一种缺失条件下的高斯混合模型聚类机器学习方法。
背景技术
近年来,聚类学习算法在人工智能机器学习领域中,仍然是一个非常值得关注且重要的研究热点。聚类是一种非常重要的无监督学习方法,其目的是在已给定了一组数据的条件下,按照数据间互相的相似性来划分为不同的簇,该划分将使得属于同一个簇的样本的相似性尽可能高,即尽量相似;使得属于不同的簇的样本差异性尽可能高,即尽量不相似。换种说法,聚类是将数据样本或特征向量等无监督地分类为一个个组簇。在许多研究背景领域中和很多研究者的努力下,聚类学习的主要问题目前已经得到了解决,这反映了它作为探索性数据分析步骤之一的广泛吸引力和实用性。然而,聚类方法的相互结合和改善仍然是一个比较难的问题,不同的研究背景和科学领域中,常常有着很多差异与不同的假设,这使得常见且有效的一些通用的概念和方法的转移结合都会发展得很慢。目前一些传统常见的聚类方法主要包括:K均值(K–means)聚类、C均值(C–means)聚类、Dbscan聚类及高斯混合模型(GMM)聚类等。由于高斯分布的普适性和广泛性以及混合模型对多模态数据的较好拟合,导致了高斯混合模型能够比较好地处理大规模多模态的数据。并且目前高斯混合模型聚类已经得到了广泛的研究和应用,并且也取得了比较好的结果。
上述的聚类算法在机器学习、模式识别、机器视觉、数据挖掘等领域被广泛研究,并已成功应用于轨迹线分析、异常检测、目标跟踪、图像分割、场景发现、社交网络等诸多场景。然而尽管现有的聚类算法在理论上和实际应用中均已取得了极大成功,但是上述的聚类算法通常都共享一个基本假设:所有数据样本的特征都是可观测的,也就是说每一个数据样本的每一个特征都没缺失。然而,在许多聚类算法的实际应用的数据收集过程中,经常会遇到无法正确收集到某些测量值或某个变量的全部测量值,因此也就造成了很多数据集中常常存在变量的特征值出现缺失的情况,从而使得聚类性能降低。
不完整数据的存在使得利用所有数据样本的信息进行聚类变得异常困难。一个直接的补救措施就是先用一种填补算法来填补缺失值,然后利用一种标准的聚类算法进行聚类。一些常用的填补算法有零填充、均值填充、k近邻填充和期望最大化填充算法和其他改进算法。这些方法试图通过预处理来减少缺失数据对聚类产生的负面影响,尽管在各种应用中展现了很好的聚类性能,但是上述算法有一个共同的缺点,它们的数据填补和聚类过程是分开进行的,导致缺失特征的填补过程不能服务于聚类任务,这抑制了两个过程之间相互的引导协调,进而降低了聚类性能。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种缺失条件下的高斯混合模型聚类机器学习方法。
为了实现以上目的,本发明采用以下技术方案:
一种缺失条件下的高斯混合模型聚类机器学习方法,包括:
S1.获取聚类任务和目标数据样本;
S2.将获取的目标数据样本中的每个样本分为可观测特征部分和缺失特征部分,对缺失特征部分进行初始填充并保持可观测特征部分的不变性;
S3.利用随机初始化选定各个高斯混合模型成分的代表点,通过极大似然估计方法建立缺失特征部分条件下的高斯混合模型聚类的优化目标函数;
S4.采用极大似然估计方法求解建立的高斯混合模型聚类的优化目标函数,实现聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江师范大学,未经浙江师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110204941.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冷却结构及驱动装置
- 下一篇:一种新型智慧城市系统及其应用方法