[发明专利]一种基于多次融合构建欺诈识别模型的方法在审

申请号：	202011366947.6	申请日：	2020-11-30
公开（公告）号：	CN112132589A	公开（公告）日：	2020-12-25
发明（设计）人：	王萍;贾坤	申请（专利权）人：	四川新网银行股份有限公司
主分类号：	G06Q20/40	分类号：	G06Q20/40;G06N5/00;G06N3/00;G06N20/00
代理公司：	成都智言知识产权代理有限公司 51282	代理人：	濮云杉
地址：	610094 四川省成都市高***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于多次融合构建欺诈识别模型方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多次融合构建欺诈识别模型的方法，其特征在于，包括：

步骤S1．数据获取：采集欺诈行为的相关数据，生成原始的数据集；

步骤S2．数据预处理：对原始的数据集进行缺失值处理、异常值处理和变量类型处理后，进行分组处理；

步骤S3．特征加工、排序：在数据预处理后，对数据集的欺诈行为特征进行特征加工，根据IV和GBDT对加工后的特征进行重要性排序，得到基于IV排序的特征集和基于GBDT排序的特征集；

步骤S4．特征选择：对基于IV排序的特征集和基于GBDT排序的特征集，通过选择计算形成m个IV特征集和m个GBDT特征集，m为自然数；

步骤S5．数据集划分：将步骤S2预处理后的数据集分为两部分，模型样本集和时点外验证集；模型样本集分为训练集和验证集，通过分层随机抽样的方法，对模型样本集进行m次随机采样，形成m个数据集，m为自然数；

步骤S6．数据建模：步骤S4中m个IV特征集、m个GBDT特征集、步骤S5中的m个数据集，以LR、XGBOOST、LIGHTGBM、GBDT为基准模型，构建单模型，每个基准模型构建的单模型有m个，m为自然数，使用步骤S5中验证集验证单模型对欺诈行为的识别效果；

步骤S7．同类模型融合：将步骤S6中以相同基准模型构建的m个单模型通过排序进行模型融合，形成同类模型，最终形成不同基准模型的不同类模型；

步骤S8．混合模型融合：通过AUC和F1将步骤S7中不同类模型进行融合，得到欺诈识别模型，使用步骤S5中时点外验证集验证欺诈识别模型对欺诈行为的识别效果。

2.如权利要求1所述的一种基于多次融合构建欺诈识别模型的方法，其特征在于，步骤S3中所述特征加工包括统计类特征加工、交叉类特征加工、描述性特征加工、交叉类特征加工、模型生成类特征加工。

3.如权利要求1所述的一种基于多次融合构建欺诈识别模型的方法，其特征在于，步骤S4中所述选择计算，具体为：对基于IV排序的特征集，选择排序后IV值排在前N个的特征集，N为自然数，并通过不放回随机抽样选取其中N个特征后随机选取m组，形成m个IV特征集，m为自然数；基于GBDT排序的特征集，选择排序后GBDT值排在前N个的特征集，通过不放回随机抽样选取其中N个特征，N为自然数，随机选取m组，形成m个GBDT特征集，m为自然数。

4.如权利要求1所述的一种基于多次融合构建欺诈识别模型的方法，其特征在于，步骤S6包括：

步骤S6.1：步骤S4中的m个IV特征集、步骤S5中的m个数据集以LR为基准模型，构建m个基于LR的单模型；

步骤S6.2：步骤S4中m个GBDT特征集、步骤S5中的m个数据集分别以XGBOOST、LIGHTGBM、GBDT为基准模型，构建m个基于XGBOOST的单模型、m个基于LIGHTGBM的单模型、m个基于GBDT的单模型。

5.如权利要求4所述的一种基于多次融合构建欺诈识别模型的方法，其特征在于，步骤S7包括：

步骤S7.1：通过AUC排序将步骤S6.1中m个基于LR的单模型进行模型融合，形成LR类模型；

步骤S7.2：通过AUC排序将步骤S6.2中m个基于XGBOOST的单模型进行模型融合，形成XGBOOST类模型；

步骤S7.3：通过PRE排序将步骤S6.2中m个基于LIGHTGBM的单模型进行模型融合，形成LIGHTGBM类模型；

步骤S7.4：通过RECALL排序将步骤S6.2中m个基于GBDT的单模型进行模型融合，形成GBDT类模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司，未经四川新网银行股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011366947.6/1.html，转载请声明来源钻瓜专利网。