[发明专利]一种风险规则提取方法及风险规则提取装置在审
申请号: | 201911097202.1 | 申请日: | 2019-11-11 |
公开(公告)号: | CN112785112A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 段戎;黄文文;潘柱新 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 风险 规则 提取 方法 装置 | ||
1.一种风险规则提取方法,其特征在于,包括:
获取N组样本数据;所述N组样本数据中任意一组样本数据包括M个变量对应的属性值;所述N为大于等于2的整数,所述M为大于等于2的整数;
利用自动编码算法、关联规则算法对所述N组样本数据进行处理,确定X个变量;所述X个变量对应的样本数据的风险系数大于第一阈值且所述X个变量的关联度大于第二阈值;所述X个变量属于所述M个变量,所述X为小于等于所述M的整数;
根据所述X个变量确定风险规则,所述风险规则用于指示所述X个变量导致风险事件所满足的条件。
2.根据权利要求1所述的方法,其特征在于,所述利用自动编码算法、关联规则算法对所述N组样本数据进行处理,确定X个变量,包括:
确定所述M个变量中重要性系数大于第三阈值的T个变量;
利用自动编码算法确定所述N组样本数据中风险系数大于所述第一阈值的S组样本数据,且所述S组样本数据仅包括所述T个变量对应的属性值;
利用关联规则算法处理所述S组样本数据,确定所述T个变量中关联度大于所述第二阈值的所述X个变量。
3.根据权利要求2所述的方法,其特征在于,所述利用自动编码算法确定所述N组样本数据中风险系数大于所述第一阈值的S组样本数据,包括:
针对所述N组样本数据中的每一组样本数据,对所述样本数据进行编码,获得第一向量,所述第一向量包括K个分量,所述K为小于等于所述M的整数;
对所述第一向量进行解码获得重构样本数据;计算所述样本数据与所述重构样本数据之间的误差分数;
对误差分数大于所述第一阈值的S组样本数据进行过滤,仅保留所述T个变量对应的属性值,获得所述S组样本数据。
4.根据权利要求2或3所述的方法,其特征在于,所述利用关联规则算法处理所述S组样本数据,确定所述T个变量中关联度大于第三阈值的所述X个变量,包括:
根据所述S组样本数据确定第一矩阵;所述第一矩阵的行数为S、列数为T,所述第一矩阵中第i行第j列的元素为第一数值或第二数值,所述第一数值表示第i组样本数据中第j个变量对应的属性值异常,所述第二数值表示所述第i组样本数据中第j个变量对应的属性值正常,所述第i组样本数据为所述S组样本数据中的第i组样本数据,所述第j个变量为所述T个变量中的第j个变量,i∈[1,2,….S],j∈[1,2,….T];
利用关联规则算法处理所述第一矩阵确定关联度大于所述第二阈值的所述X个变量。
5.根据权利要求4所述的方法,其特征在于,所述利用关联规则算法处理所述第一矩阵获得所述X个变量,包括:
根据所述第一矩阵确定至少一个候选项集;所述候选项集的属性为所述T个变量中的任意一个或多个,所述候选项集的值为所述第一数值或所述第二数值;
根据所述至少一个候选项集确定关联度大于所述第二阈值的所述X个变量。
6.根据权利要求5所述的方法,其特征在于,根据所述至少一个候选项集确定关联度大于所述第二阈值的所述X个变量,包括:
所述X个变量满足:
其中,Q代表所述第一矩阵中目标行的数量,所述目标行中X个目标列上的元素均为第一数值,所述X个目标列与所述X个变量对应,p1为所述第二阈值。
7.根据权利要求5所述的方法,其特征在于,根据所述至少一个候选项集确定关联度大于所述第二阈值的所述X个变量,包括:
所述X个变量满足:
其中,Q代表所述第一矩阵中目标行的数量,所述目标行中X个目标列上的元素均为第一数值,所述X个目标列与所述X个变量对应,p2为所述第二阈值,yt代表Q个目标行中第t个目标行对应的样本数据的误差分数,Z代表所述S组样本数据的误差分数之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911097202.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据获取方法、装置以及计算机存储介质
- 下一篇:一种食用菌培育方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理