[发明专利]一种高斯混合模型树及其递增聚类方法有效
申请号: | 201410035056.0 | 申请日: | 2014-01-24 |
公开(公告)号: | CN103823843B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 刘峡壁;伍艺;万玉钗 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 模型 及其 递增 方法 | ||
1.一种高斯混合模型树,其特征在于:高斯混合模型树的叶子节点对应着单个高斯成分,反映了该高斯混合模型树中最稠密的数据分布,分布的稠密程度由单高斯成分的最大方差控制;数据稠密程度自下而上变得稀疏,树的高层节点由低层的节点组合而成,即高斯成分的组合,高层节点对应更稀疏的数据分布,根节点对应着整个数据集的高斯分布,也是该高斯混合模型树中最稀疏的数据分布;该高斯混合模型树由上述的叶子节点和高层节点构成,反映了数据聚类、子聚类、整个数据集的关系。
2.根据权利要求1所述的一种高斯混合模型树,其特征在于:高层节点对应高斯混合模型;树的构建方式是自底向上的。
3.一种高斯混合模型树的递增聚类方法,其特征在于,包括四个技术环节:数据插入、更新聚类树、数据删除和聚类结果确定;这四个技术环节的关系为:对于每一个新数据,都插入到现有的高斯混合模型树,再根据插入的结果更新聚类树;随着新数据的插入,检查已经插入到聚类树的数据是否需要删除,如果需要删除,则删除数据;当所有数据读取完成之后,确定聚类结果;具体实现步骤如下:
技术环节1、数据插入:将每一个新数据插入至高斯混合模型树的叶子层,有可能插入到现有的叶子节点,也有可能生成新的叶子节点;
技术环节2、更新聚类树:当新的数据被插入到最恰当的叶子节点后,当前的高斯混合模型树的结构和参数会随之更新,更新的节点包括插入新数据的叶子节点和与之相关的高层节点;聚类树结构的变化主要体现在非叶子节点是否需要分裂,参数的变化包括叶子节点中单个高斯成分的参数、非叶子节点中高斯混合模型的参数;
技术环节3、在聚类过程中,允许用户删除之前已经插入到高斯混合模型树中的数据,首先定位到保存了要删除数据的叶子节点,删除该数据,判断叶子节点是否需要分裂,再如技术环节2所述更新聚类树;
技术环节4、聚类结果确定:本发明提出的方法可以根据用户对聚类结果的稠密程度的需求不同,确定不同的层作为聚类结果,在用户没有指定特殊需求的情况下,选择根节点的孩子节点这一层作为聚类结果返回给用户。
4.根据权利要求3所述的一种高斯混合模型树的递增聚类方法,其特征在于,技术环节1中判断是否生成新叶子节点的标准为:计算新插入的数据与叶子节点的均值的欧氏距离。
5.根据权利要求3所述的一种高斯混合模型树的递增聚类方法,其特征在于,更新聚类树结构时,通过计算非叶子节点对应的子节点的连通图个数来判断是否要分裂以及分裂的个数。
6.根据权利要求3所述的一种高斯混合模型树的递增聚类方法,其特征在于,删除叶子节点中的数据之后要判断叶子节点是否需要分裂,判断的标准是计算该叶子节点对应的方差是否大于预先设置的阈值;如果需要分裂,分裂的个数通过计算该叶子节点对应的数据的连通图个数决定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410035056.0/1.html,转载请声明来源钻瓜专利网。