[发明专利]子空间聚类的方法及装置在审

专利信息
申请号: 201510981942.7 申请日: 2015-12-22
公开(公告)号: CN105426540A 公开(公告)日: 2016-03-23
发明(设计)人: 杨焕滨 申请(专利权)人: TCL集团股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳中一专利商标事务所 44237 代理人: 张全文
地址: 516006 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 空间 方法 装置
【说明书】:

技术领域

发明属于计算机技术领域,尤其涉及子空间聚类的方法及装置。

背景技术

在高维数据聚类中,常常由于数据的稀疏或不同维度的冗余,导致聚类时间复杂度和空间复杂度高,聚类效果差,子空间聚类方法的提出,使之成为了解决上述问题的有效途径之一。常用的子空间聚类方法有CLIQUE,以及在CLIQUE方法的基础之上衍生出来的其他方法。CLIQUE方法采用类似Apriori算法的方式,在高维数据中将每个维度按照数据密度进行划分,然后从低维往高维组合出可聚类的高维子空间。

CLIQUE方法通过网格对数据密度进行划分,然而,在数据集分布并不按照网格划分的情况之下(如图1所示的情况),通过CLIQUE方法就无法得到合理的聚类效果。

发明内容

有鉴于此,本发明实施例提供了子空间聚类的方法及装置,以解决在数据集分布并不按照网格划分的情况之下,通过CLIQUE方法无法得到合理的聚类效果问题。

第一方面,提供了一种子空间聚类的方法,包括:

初始化SSAm=0,并随机生成mT个不为零的cj,所述SSAm为m维K-means组合聚类得到的类间离差和,所述cj为一维空间的聚类中心,所述mT表示原始数据集共有mT个维度,所述m表示预设子空间共有m个维度;

使用所述cj在每个维度上分别进行一维K-means聚类,得到每个维度的类间离差和SSA1

基于mT个类间离差和SSA1,选取∑SSA1最大且还未组合聚类过的m个维度;

若已经选取完m个维度在所述mT个维度中的所有组合或存在∑SSA1≤SSAm,则将SSAm对应的聚类结果输出;

若∑SSA1>SSAm,使用当前选取的m个维度对应的cj作为聚类初始值进行K-means组合聚类,并且计算得到对应的类间离差和SSAm′;

返回执行所述基于mT个类间离差和SSA1,选取∑SSA1最大且还未组合聚类过的m个维度的操作,且若存在SS′Am>SSAm,则在所述返回执行前设置SSAm=SS′Am

另一方面,提供了一种子空间聚类的装置,包括:

初始化单元,用于初始化SSAm=0,并随机生成mT个不为零的cj,所述SSAm为m维K-means组合聚类得到的类间离差和,所述cj为一维空间的聚类中心,所述mT表示原始数据集共有mT个维度,所述m表示预设子空间共有m个维度;

排序单元,用于使用所述cj在每个维度上分别进行一维K-means聚类,得到每个维度的类间离差和SSA1

选取单元,用于基于mT个类间离差和SSA1,选取∑SSA1最大且还未组合聚类过的m个维度;

输出单元,用于若已经选取完m个维度在所述mT个维度中的所有组合或存在∑SSA1≤SSAm,则将SSAm对应的聚类结果输出;

计算单元,若∑SSA1>SSAm,使用当前选取的m个维度对应的cj作为聚类初始值进行K-means组合聚类,并且计算得到对应的类间离差和SSAm′;

迭代单元,用于返回执行所述选取单元的操作,且若存在SS′Am>SSAm,则在所述返回执行前设置SSAm=SS′Am

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510981942.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top