[发明专利]业务数据的关联分析方法、装置、计算机设备及存储介质在审
申请号: | 201910301146.2 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110162566A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 李家捷 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/903;G06F16/906 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 林彦之 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 频繁项集 候选项 计算机设备 存储介质 关联分析 业务数据 置信度 候选数据集 历史业务数据 业务数据库 关联规则 规则结果 决策支持 数据关联 业务提供 项关联 预设置 支持度 信度 销售 决策 | ||
本发明公开了一种业务数据的关联分析方法、装置、计算机设备及存储介质,根据业务数据库和/或数据表生成候选数据集,根据候选数据集生成第一候选项集,根据第一候选项集生成第一频繁项集,根据第一频繁项集生成包括至少两个频繁项的第二候选项集,根据第二候选项集生成第二频繁项集,对第二频繁项集进行关联规则计算,得到第二频繁项集中多个频繁项之间的置信度,得到置信度满足预设置信度阈值的频繁项关联规则结果。本发明所提出的业务数据的关联分析方法、计算机设备及存储介质,能够实现根据历史业务数据得到不同支持度和不同置信度的数据关联结果,可为新的销售业务提供决策支持,而且对销售决策的支持更有效率、更科学。
技术领域
本发明涉及数据挖掘分析领域,特别是涉及一种业务数据的关联分析方法、装置、计算机设备及存储介质。
背景技术
目前,在涉及诸如销售决策这种主要依靠人主观经验的领域中,缺少一种有效的利用算法对特定数据进行关联分析来支持决策的方法,由于决策过程涉及众多变量需要考虑,对应到数据挖掘算法中,则对应众多的数据项,同时对这些数据进行分析计算量大,耗时较长,成本较高。
发明内容
有鉴于此,本发明提出一种业务数据的关联分析方法、计算机设备及存储介质,能够对历史业务数据进行管理分析为新的销售业务提供决策支持依据,且分析计算量小,耗时短。
首先,为实现上述目的,本发明提出一种业务数据的关联分析方法,所述方法包括:
根据业务数据库和/或数据表生成包括预设待挖掘分析数据项的候选数据集;
根据所述候选数据集生成第一候选项集,所述第一候选集包括待分析数据项及待分析数据项对应的支持度;
根据所述第一候选项集生成满足大于第一最小支持度的第一频繁项集;
根据所述第一频繁项集生成包括至少两个频繁项的第二候选项集;
根据所述第二候选项集生成满足大于第二最小支持度的第二频繁项集;
对所述第二频繁项集进行关联规则计算,得到第二频繁项集中多个频繁项之间的置信度;
得到置信度满足预设置信度阈值的频繁项关联规则结果。
进一步地,所述根据业务数据库和/或数据表生成包括预设待挖掘分析数据项的候选数据集包括:
获取包括特定数据项且该特定数据项满足预设条件的业务数据库和/或数据表;
从所述数据库和/或数据表中筛选出预设待挖掘分析的数据项并进行分类以生成候选数据集。
进一步地,所述从所述数据库和/或数据表中筛选出预设待挖掘分析的数据项并进行分类以生成候选数据集包括:
将所述业务数据库和/或数据表中包含的数据项的类型输出至用户界面;
根据用户的第一操作指令确定所需的待挖掘分析的数据项的类型;
从所述业务数据库和/或数据表中筛选出相应类型的数据项;
对筛选出的数据项进行分类,生成候选数据集。
进一步地,所述待分析数据项对应的支持度的计算方法包括:
计算所述候选数据集中待分析数据项的总量,其中,所述待分析数据项的总量为不同数据项的出现次数的最大值或特定数据项在所述候选数据集中实际数据的数量;
计算支持度,其中,所述支持度为当前待分析数据项的出现次数/待分析数据项的总量。
进一步地,所述根据所述第一频繁项集生成包括至少两个频繁项的第二候选项集包括:
将所述第一频繁项集按照顺序排列组合生成第二候选集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910301146.2/2.html,转载请声明来源钻瓜专利网。