[发明专利]对数据进行聚类的方法、设备和系统有效
申请号: | 200910126215.7 | 申请日: | 2009-03-09 |
公开(公告)号: | CN101833553A | 公开(公告)日: | 2010-09-15 |
发明(设计)人: | 范志刚;李季檩;吴亚栋;吴波;陈芒 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王波波 |
地址: | 日本国大阪府大阪市阿倍野*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 进行 方法 设备 系统 | ||
1.一种对数据进行聚类的方法,包括步骤:
针对输入的数据项创建分级式生成树;
对创建的分级式生成树执行迭代式图缩减,以便缩减分级式生成树上的边缘点;
对缩减后的分级式生成树执行受约束的图切分处理,以计算分级式生成树中每个边的切分值;以及
选择具有最大切分值的边作为要切分的位置来将分级式生成树切分成子树来获得聚类结果。
2.如权利要求1所述的方法,其中所述针对输入的数据项创建分级式生成树的步骤包括:
从包括多个数据项的列表中取一个数据项,并且计算它与列表中的其他数据项的距离;
将彼此之间的距离小于第一距离阈值的所有数据点放在一个超球内;
从列表中移除彼此之间的距离小于第二距离阈值的所有数据项,其中第一距离阈值大于第二距离阈值;
针对所述超球,创建最小生成树;
对于具有重叠数据点的任意两个超球,将最接近的数据点链接起来;
在所有超球中,将超球看作数据点,删除一些边,从而使得将所有超球链接在一起的剩余边形成针对这些超球的最小生成树,作为所述分级式生成树。
3.如权利要求1所述的方法,其中所述对创建的分级式生成树执行迭代式图缩减的步骤包括:
重复如下过程来缩减分级式生成树:
删除与分级式生成树的边缘点联系的边;
将分级式生成树的所有的边缘点收缩到分级式生成树上;以及
融合新的边缘点。
4.如权利要求3所述的方法,其中所述对创建的分级式生成树执行迭代式图缩减的步骤还包括:
标记缩减后的分级式生成树的边缘点。
5.如权利要求1所述的方法,其中切分值的计算包括:
基于两个数据点所在的集合之间的距离和各个集合中数据点的稀疏度来计算连接两个数据点的边的图切分值。
6.一种对数据进行聚类的设备,包括:
分级式生成树创建单元,针对输入的数据项创建分级式生成树;
图缩减单元,对创建的分级式生成树执行迭代式图缩减,以便缩减分级式生成树上的边缘点;
图切分单元,对缩减后的分级式生成树执行受约束的图切分处理,以计算分级式生成树中每个边的切分值;以及
分级式分割单元,选择具有最大切分值的边作为要切分的位置来将分级式生成树切分成多个子树来获得聚类结果。
7.如权利要求6所述的设备,其中所述分级式生成树创建单元从包括多个数据项的列表中取一个数据项,并且计算它与列表中的其他数据项的距离,将彼此之间的距离小于第一距离阈值的所有数据点放在一个超球内,从列表中移除彼此之间的距离小于第二距离阈值的所有数据项,其中第一距离阈值大于第二距离阈值,针对所述超球,创建最小生成树,对于具有重叠数据点的任意两个超球,将最接近的数据点链接起来,在所有超球中,将超球看作数据点,删除一些边,从而使得将所有超球链接在一起的剩余边形成针对这些超球的最小生成树,作为所述分级式生成树。
8.如权利要求6所述的设备,其中所述图缩减单元重复如下过程来缩减分级式生成树:
删除与分级式生成树的边缘点联系的边;
将分级式生成树的所有的边缘点收缩到分级式生成树上;以及
融合新的边缘点。
9.如权利要求8所述的设备,其中所述图缩减单元还标记缩减后的分级式生成树的边缘点。
10.如权利要求6所述的设备,其中图切分单元基于两个数据点所在的集合之间的距离和各个集合中数据点的稀疏度来计算连接两个数据点的边的图切分值。
11.一种信息处理系统,包括如权利要求6~10之一所述的设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910126215.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置