[发明专利]一种基于异常样本的关联规则挖掘方法、系统、终端及存储介质有效
申请号: | 202110702650.0 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113420069B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 蒋雪涵;孙行智 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F17/16 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 异常 样本 关联 规则 挖掘 方法 系统 终端 存储 介质 | ||
1.一种基于异常样本的关联规则挖掘方法,其特征在于,包括:
获取待挖掘样本数据,所述待挖掘样本数据包括正常样本和异常样本,且每个样本中至少包括一个统计项目;
从所述待挖掘样本数据中学习各个统计项目的共现条件概率,根据所述共现条件概率预测每个统计项目在各个样本中的出现概率;
根据所述统计项目在各个样本中的出现概率与所述统计项目在各个样本中的真实出现情况计算各个样本的异常分数,并根据所述异常分数将所述待挖掘样本数据划分为正常样本和异常样本;
采用关联规则挖掘算法对所述正常样本进行关联规则挖掘,得到候选关联规则;
计算所述候选关联规则在异常样本中的违反分数,通过所述违反分数对所述候选关联规则进行筛选,得到最终的关联规则;
所述采用关联规则挖掘算法对所述正常样本进行关联规则挖掘,得到候选关联规则具体为:
根据所述关联规则挖掘算法的规则支持度和置信度标准,从所述正常样本中挖掘出支持度和置信度高于设定阈值的关联规则作为所述候选关联规则;
所述计算所述候选关联规则在异常样本中的违反分数,通过所述违反分数对所述候选关联规则进行筛选具体为:
将所述违反分数高于预设分数的关联规则作为最终的关联规则;其中,所述关联规则的违反分数vlt_score越高,表示该关联规则在异常样本中的违反程度高于其在正常样本中的违反程度。
2.根据权利要求1所述的基于异常样本的关联规则挖掘方法,其特征在于,所述获取待挖掘样本数据还包括:
获取所述待挖掘样本数据中各个样本的统计项目出现矩阵X;所述统计项目出现矩阵X的尺寸为N*m,N为样本的数量,m为所有统计项目的个数,统计项目出现矩阵X的每一行分别表示一个样本,除第一列之外,所述统计项目出现矩阵X的每一列分别表示各统计项目是否在每个样本中出现。
3.根据权利要求2所述的基于异常样本的关联规则挖掘方法,其特征在于,所述从所述待挖掘样本数据中学习各个统计项目的共现条件概率,根据所述共现条件概率预测每个统计项目在各个样本中的出现概率具体为:
将所述统计项目出现矩阵X输入受限玻尔兹曼机网络;
所述受限玻尔兹曼机网络从所述统计项目出现矩阵X中学习各个统计项目的共现条件概率矩阵B;
根据所述共现条件概率矩阵B预测每个统计项目在各个样本中的出现概率矩阵
4.根据权利要求3所述的基于异常样本的关联规则挖掘方法,其特征在于,所述根据所述统计项目在各个样本中的出现概率与所述统计项目在各个样本中的真实出现情况计算各个样本的异常分数,并根据所述异常分数将所述待挖掘样本数据划分为正常样本和异常样本具体为:
分别计算各个样本的统计项目出现矩阵X和概率矩阵的差平方和sample_abs;
将差平方和sample_abs的取值高于设定阈值的样本划分为异常样本;
将差平方和sample_abs的取值低于设定阈值的样本划分为正常样本,其中,所述差平方和的计算公式为:
5.根据权利要求1所述的基于异常样本的关联规则挖掘方法,其特征在于,所述违反分数vlt_score的计算公式为:
其中,L→R表示从所述正常样本中得到的候选关联规则,L为关联规则的前件,表示规则起效的条件,R为关联规则的后件,表示规则对应的结果,L的发生可推理出R的发生;ab_sup(L)表示所述异常样本中出现L的概率,分母为异常样本的数量,分子为异常样本中出现L的样本数量;ab_sup(L\R)表示所述异常样本中出现L且不出现R的概率,分母为异常样本中出现L的样本数量,分子为所述异常样本中出现L且不出现R的样本数量;n_sup(L)表示所述正常样本中出现L的概率,分母为正常样本的数量,分子为正常样本中出现L的样本数量;n_sup(L\R)表示所述正常样本中出现L且不出现R的概率,分母为正常样本中出现L的样本数量,分子为正常样本中出现L且不出现R的样本数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110702650.0/1.html,转载请声明来源钻瓜专利网。