[发明专利]一种高斯混合模型树及其递增聚类方法有效
申请号: | 201410035056.0 | 申请日: | 2014-01-24 |
公开(公告)号: | CN103823843B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 刘峡壁;伍艺;万玉钗 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种高斯混合模型树及其递增聚类方法,属于计算机应用技术中的聚类技术领域。该方法包括两部分1、一种新的聚类结构——高斯混合模型树(聚类树);2、在(1)的基础上,提出基于高斯混合模型树的递增聚类方法;其中,递增聚类方法包括数据插入、更新聚类树、数据删除和聚类结果确定。这四个技术环节的关系为对于每一个新数据,都需要插入到现有的高斯混合模型树,再根据插入的结果更新聚类树;随着新数据的插入,检查已经插入到聚类树的数据是否需要删除,如果需要删除,则删除数据;当所有数据读取完成之后,确定聚类结果。本发明的方法在聚类的准确率、执行效率和稳定性方面都可以获得较好的效果。 | ||
搜索关键词: | 一种 混合 模型 及其 递增 方法 | ||
【主权项】:
一种高斯混合模型树及其递增聚类方法,其特征在于:包括两部分:(1)高斯混合模型树,即聚类树是基于高斯混合模型,即Gaussian Mixture Model简称GMM,和树型结构的;其中,节点对应高斯混合模型;树的构建方式是自底向上的;高斯混合模型树的叶子节点对应着单个高斯成分,反映了该高斯混合模型树中最稠密的数据分布,分布的稠密程度由单高斯成分的最大方差控制;数据稠密程度自下而上变得稀疏,树的高层节点由低层的节点组合而成,即高斯成分的组合,高层节点对应更稀疏的数据分布,根节点对应着整个数据集的高斯分布,也是该高斯混合模型树中最稀疏的数据分布;该高斯混合模型树由上述的叶子节点和高层节点构成,反映了数据聚类、子聚类、整个数据集的关系;每个聚类簇对应一个高斯混合模型,整个数据集的数据分布可看作由多个高斯混合模型组合而成,而这多个高斯混合模型的组成又可以看作一个更大的高斯混合模型;叶子节点对应着最稠密的数据分布,随着树的层级的增高,数据分布越来越稀疏;(2)在(1)的基础上,提出基于高斯混合模型树的递增聚类方法,即生成数据集对应的高斯混合模型的过程即构建聚类树的过程,本发明提出的方法采用自底向上的方式构建树,构建树的过程也反映了递增聚类的过程;包括四个技术环节:数据插入、更新聚类树、数据删除和聚类结果确定;这四个技术环节的关系为:对于每一个新数据,都插入到现有的高斯混合模型树,再根据插入的结果更新聚类树;随着新数据的插入,检查已经插入到聚类树的数据是否需要删除,如果需要删除,则删除数据;当所有数据读取完成之后,确定聚类结果;具体实现步骤如下:技术环节1、数据插入:将每一个新数据插入至高斯混合模型树的叶子层,有可能插入到现有的叶子节点,也有可能生成新叶子节点;判断是否生成新叶子节点的标准为:计算新插入的数据与叶子节点的均值的欧氏距离;技术环节2、更新聚类树:当新的数据被插入到最恰当的叶子节点后,当前的高斯混合模型树的结构和参数会随之更新,更新的节点包括插入新数据的叶子节点和与之相关的高层节点;聚类树结构的变化主要体现在高层节点是否需要分裂,参数的变化包括叶子节点中单个高斯成分的参数、高层节点中高斯混合模型的参数;更新聚类树结构时,通过计算高层节点对应的子节点的连通图个数来判断是否要分裂以及分裂的个数;技术环节3、在聚类过程中,允许用户删除之前已经插入到高斯混合模型树中的数据,首先定位到保存了要删除数据的叶子节点,删除该数据,判断叶子节点是否需要分裂,再如技术环节2所述更新聚类树;删除叶子节点中的数据之后要判断叶子节点是否需要分裂,判断的标准是计算该叶子节点对应的方差是否大于预先设置的阈值;如果需要分裂,分裂的个数通过计算该叶子节点对应的数据的连通图个数决定;技术环节4、聚类结果确定:本发明提出的方法可以根据用户对聚类结果的稠密程度的需求不同,确定不同的层作为聚类结果,在用户没有指定特殊需求的情况下,选择根节点的孩子节点这一层作为聚类结果返回给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410035056.0/,转载请声明来源钻瓜专利网。