[发明专利]数据聚类方法、系统及计算机可读存储介质在审
申请号: | 202111032880.7 | 申请日: | 2021-09-03 |
公开(公告)号: | CN114254690A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 奥斯曼·阿西夫·马利克;牛岛隼人;阿夫拉迪普·曼达尔;英德雷普·高希;阿纳博·罗伊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16;G06F30/20;G06N10/00;G06F111/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈炜;杨丽琴 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 系统 计算机 可读 存储 介质 | ||
公开了一种数据聚类方法、系统及计算机可读存储介质。一种方法可以包括:获得表示数据集中的数据的第一矩阵;以及获得数据将要被分组成的集群的数目。该方法还可以包括:使用第一矩阵和集群的数目来构建第二矩阵。第二矩阵可以表示在第二优化问题的框架中对第一优化问题的公式表示。该方法还可以包括:使用第二矩阵求解第二优化问题以生成第二优化问题的解;以及将第二优化问题的解映射到表示第一优化问题的解的第一解矩阵中。该方法还可以包括:使用第一解矩阵将数据分组成多个数据集群。多个数据集群的数目可以等于集群的数目。
技术领域
本公开内容中讨论的实施方式涉及数据的聚类。
背景技术
数据可以被分组成数据集群。聚类的数据可以用于许多领域的统计数据分析。例如,可以使用数据集群的领域可以包括模式识别、图像分析、信息检索、生物信息学、数据压缩、计算机图形学和机器学习等。
本公开内容中要求保护的主题不限于解决任何缺点或者仅在诸如上述环境的环境中工作的实施方式。而是,仅提供该背景技术来说明其中可以实践本公开内容中描述的一些实施方式的一个示例技术领域。
发明内容
在示例实施方式中,一种方法可以包括:获得表示数据集中的数据的第一矩阵,以及获得数据将要被分组成的集群的数目。该方法还可以包括:使用第一矩阵和集群的数目来构建第二矩阵。在一些实施方式中,第二矩阵可以表示在第二优化问题的框架中对第一优化问题的公式表示。该方法还可以包括:使用第二矩阵求解第二优化问题,以生成第二优化问题的解;以及将第二优化问题的解映射到表示第一优化问题的解的第一解矩阵中。该方法还可以包括:使用第一解矩阵将数据分组成多个数据集群。在一些实施方式中,多个数据集群的数目可以等于集群的数目。
实施方式的目的和优点将至少通过权利要求书中特别指出的元素、特征和组合来实现和完成。
前面的总体描述和下面的详细描述两者均作为示例给出,并且是说明性的而不是对所要求保护的本发明的限制。
附图说明
将通过使用附图,更具体地且更详细地描述和说明示例实施方式,在附图中:
图1示出了用于数据集群的示例操作流程;
图2示出了可以用于使数据聚类的示例矩阵;
图3示出了可以在使数据聚类时使用的示例方法的流程图;
图4示出了可以在使数据聚类时使用的另一示例方法的流程图;
图5示出了数据聚类的示例方法的流程图;以及
图6示出了可以用于数据聚类的示例系统。
具体实施方式
随着技术的进步,可以收集和存储大量数据。可以从数据中获得信息。在一些情况下,可以通过将数据分组成数据集群来从数据中获得信息。例如,可以基于类似的特性对数据进行分组。
在一些情况下,可以以矩阵形式来表示数据。可以通过对矩阵的行和/或列进行分组,将数据以矩阵形式分组成数据集群。例如,可以从多个个人收集关于他们基因的数据。信息可以被排列在矩阵中。可以基于他们的基因将个人分组成集群,以识别个人中的哪些个人可能更容易患某些疾病,例如癌症。
在一些情况下,可以使用二进制矩阵分解(BMF)来执行将矩阵中的数据分组成数据集群。矩阵的分解将矩阵表示为两个或更多个矩阵的乘积。可以使用可以限定因分解而得到的两个或更多个矩阵的大小的整数来执行分解。例如,可以使用整数k将m×n矩阵A分解为m×k矩阵B和k×n矩阵C。可以执行BMF以使矩阵B和矩阵C的乘积与矩阵A之间的差最小化。当对矩阵执行BMF以在矩阵中分组数据时,整数k可以表示待确定的数据集群的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111032880.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置