[发明专利]子空间聚类的方法及装置在审
申请号: | 201510981942.7 | 申请日: | 2015-12-22 |
公开(公告)号: | CN105426540A | 公开(公告)日: | 2016-03-23 |
发明(设计)人: | 杨焕滨 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 516006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空间 方法 装置 | ||
技术领域
本发明属于计算机技术领域,尤其涉及子空间聚类的方法及装置。
背景技术
在高维数据聚类中,常常由于数据的稀疏或不同维度的冗余,导致聚类时间复杂度和空间复杂度高,聚类效果差,子空间聚类方法的提出,使之成为了解决上述问题的有效途径之一。常用的子空间聚类方法有CLIQUE,以及在CLIQUE方法的基础之上衍生出来的其他方法。CLIQUE方法采用类似Apriori算法的方式,在高维数据中将每个维度按照数据密度进行划分,然后从低维往高维组合出可聚类的高维子空间。
CLIQUE方法通过网格对数据密度进行划分,然而,在数据集分布并不按照网格划分的情况之下(如图1所示的情况),通过CLIQUE方法就无法得到合理的聚类效果。
发明内容
有鉴于此,本发明实施例提供了子空间聚类的方法及装置,以解决在数据集分布并不按照网格划分的情况之下,通过CLIQUE方法无法得到合理的聚类效果问题。
第一方面,提供了一种子空间聚类的方法,包括:
初始化SSAm=0,并随机生成mT个不为零的cj,所述SSAm为m维K-means组合聚类得到的类间离差和,所述cj为一维空间的聚类中心,所述mT表示原始数据集共有mT个维度,所述m表示预设子空间共有m个维度;
使用所述cj在每个维度上分别进行一维K-means聚类,得到每个维度的类间离差和SSA1;
基于mT个类间离差和SSA1,选取∑SSA1最大且还未组合聚类过的m个维度;
若已经选取完m个维度在所述mT个维度中的所有组合或存在∑SSA1≤SSAm,则将SSAm对应的聚类结果输出;
若∑SSA1>SSAm,使用当前选取的m个维度对应的cj作为聚类初始值进行K-means组合聚类,并且计算得到对应的类间离差和SSAm′;
返回执行所述基于mT个类间离差和SSA1,选取∑SSA1最大且还未组合聚类过的m个维度的操作,且若存在SS′Am>SSAm,则在所述返回执行前设置SSAm=SS′Am。
另一方面,提供了一种子空间聚类的装置,包括:
初始化单元,用于初始化SSAm=0,并随机生成mT个不为零的cj,所述SSAm为m维K-means组合聚类得到的类间离差和,所述cj为一维空间的聚类中心,所述mT表示原始数据集共有mT个维度,所述m表示预设子空间共有m个维度;
排序单元,用于使用所述cj在每个维度上分别进行一维K-means聚类,得到每个维度的类间离差和SSA1;
选取单元,用于基于mT个类间离差和SSA1,选取∑SSA1最大且还未组合聚类过的m个维度;
输出单元,用于若已经选取完m个维度在所述mT个维度中的所有组合或存在∑SSA1≤SSAm,则将SSAm对应的聚类结果输出;
计算单元,若∑SSA1>SSAm,使用当前选取的m个维度对应的cj作为聚类初始值进行K-means组合聚类,并且计算得到对应的类间离差和SSAm′;
迭代单元,用于返回执行所述选取单元的操作,且若存在SS′Am>SSAm,则在所述返回执行前设置SSAm=SS′Am。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510981942.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于贝塞尔统计模型的图像检索方法
- 下一篇:新型温度杯