[发明专利]基于关联关系的数据挖掘方法和装置在审
申请号: | 201810903048.1 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109213801A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 梁琛;刘子奇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联关系 连通 数据挖掘 子集 目标类型 关联关系建立 方法和装置 挖掘 | ||
本说明书提供一种基于关联关系的数据挖掘方法,所述关联关系建立在若干个主体之间;所述主体包括至少两种类型,其中至少一种类型为挖掘目标类型;所述方法包括:根据主体之间的关联关系,将所有主体划分为若干个连通子集;所述连通子集包括至少一个成员主体,一个连通子集中包括与每个成员主体具有关联关系的所有主体;采用包含至少两个属于挖掘目标类型的成员主体的连通子集进行数据挖掘。
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种基于关联关系的数据挖掘方法和装置。
背景技术
随着互联网的发展和普及,各种基于网络进行的活动都在源源不断的产生数据,许多企业、政府甚至个人等都掌握着大量的用户数据。数据挖掘技术能够从大量的数据中发现有价值的知识、模式、规则等信息,为科学研究、商业决策、过程控制等提供辅助支持,成为数据利用的重要方式。
在一些应用场景中,用于挖掘的数据记录能够体现相同或者不同类型的主体之间的关联关系。例如,可以通过转账记录在付款方与收款方之间建立关联关系;在账户登录记录中,账户与登录时所使用的设备之间具有关联关系。基于关联关系的数据挖掘广泛应用于网络安全、商业营销等领域,这些领域的数据挖掘需求通常随业务发展不断变化,提高数据挖掘的速度对及时满足业务要求具有重要的意义。
发明内容
有鉴于此,本说明书提供一种基于关联关系的数据挖掘方法,所述关联关系建立在若干个主体之间;所述主体包括至少两种类型,其中至少一种类型为挖掘目标类型;所述方法包括:
根据主体之间的关联关系,将所有主体划分为若干个连通子集;所述连通子集包括至少一个成员主体,一个连通子集中包括与每个成员主体具有关联关系的所有主体;
采用包含至少两个属于挖掘目标类型的成员主体的连通子集进行数据挖掘。
本说明书还提供了一种基于关联关系的数据挖掘装置,所述关联关系建立在若干个主体之间;所述主体包括至少两种类型,其中至少一种类型为挖掘目标类型;所述装置包括:
连通子集单元,用于根据主体之间的关联关系,将所有主体划分为若干个连通子集;所述连通子集包括至少一个成员主体,一个连通子集中包括与每个成员主体具有关联关系的所有主体;
挖掘执行单元,用于采用包含至少两个属于挖掘目标类型的成员主体的连通子集进行数据挖掘。
本说明书提供的一种计算机设备,包括:存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行上述基于关联关系的数据挖掘方法所述的步骤。
本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述基于关联关系的数据挖掘方法所述的步骤。
由以上技术方案可见,本说明书的实施例中,将所有具有关联关系的主体划分至一个连通子集中,在所有连通子集中以包含至少两个属于挖掘目标类型的成员主体的连通子集作为数据源进行数据挖掘;由于不包含或仅包含一个属于挖掘目标类型的成员主体的连通子集对数据挖掘结果的影响几乎可以忽略不计,本说明书的实施例在基本不影响挖掘效果的前提下,减少了挖掘时需要处理的数据量,加快了数据挖掘的速度,提高了挖掘效率。
附图说明
图1是本说明书实施例中一种基于关联关系的数据挖掘方法的流程图;
图2是本说明书应用示例中一种仅包含一个属于挖掘目标类型的节点的最大连通子图的结构示例图;
图3是本说明书应用示例中一种包含两个及以上属于挖掘目标类型的节点的最大连通子图的结构示例图;
图4是运行本说明书实施例的设备的一种硬件结构图;
图5是本说明书实施例中一种基于关联关系的数据挖掘装置的逻辑结构图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810903048.1/2.html,转载请声明来源钻瓜专利网。