[发明专利]一种风控模型训练方法及装置在审
申请号: | 201710063767.2 | 申请日: | 2017-02-03 |
公开(公告)号: | CN106875185A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 王慧;袁峰;周振生 | 申请(专利权)人: | 咪咕互动娱乐有限公司 |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06Q10/06;G06F17/30 |
代理公司: | 北京派特恩知识产权代理有限公司11270 | 代理人: | 蒋雅洁,张颖玲 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 | ||
1.一种风控模型训练方法,其特征在于,所述方法包括:
获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;
根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;
使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;
使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。
2.根据权利要求1所述的方法,其特征在于,所述账户信息包括多种类型;
所述根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型,包括:
根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,根据所述第一数据挖掘模型生成数据挖掘模型组;
在所述数据挖掘模型组中针对所有所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型。
3.根据权利要求2所述的方法,其特征在于,所述账户信息的类型包括如下至少一种:消费敏感型、订购异常型、非真实型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,包括:
使用所述第一历史数据组中的第三数据集合训练各种数据挖掘模型后,使用所述第一历史数据组中的第四数据集合验证所述数据挖掘模型;
选取所述账户信息的类型对应的拟合度最高的数据挖掘模型为第一数据挖掘模型。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述数据挖掘模型的类型包括如下至少一种:CRT、C5.0、CHAID、Logistic、SVM、自动分类器和贝叶斯网络。
6.一种风控模型训练装置,其特征在于,所述装置包括:
获取单元,用于获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;
第一选取单元,用于根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;
生成单元,用于使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;
第二选取单元,用于使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。
7.根据权利要求6所述的装置,其特征在于,所述账户信息包括多种类型;所述第一选取单元包括:
生成子单元,用于根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,根据所述第一数据挖掘模型生成数据挖掘模型组;
选取子单元,用于在所述数据挖掘模型组中针对所有所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型。
8.根据权利要求7所述的装置,其特征在于,所述账户信息的类型包括如下至少一种:消费敏感型、订购异常型、非真实型。
9.根据权利要求8所述的装置,其特征在于,所述生成子单元还用于:
使用所述第一历史数据组中的第三数据集合训练各种数据挖掘模型后,使用所述第一历史数据组中的第四数据集合验证所述数据挖掘模型;
选取所述账户信息的类型对应的拟合度最高的数据挖掘模型为第一数据挖掘模型。
10.根据权利要求6至9任一项所述的装置,其特征在于,所述数据挖掘模型的类型包括如下至少一种:CRT、C5.0、CHAID、Logistic、SVM、自动分类器和贝叶斯网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕互动娱乐有限公司,未经咪咕互动娱乐有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710063767.2/1.html,转载请声明来源钻瓜专利网。