[发明专利]风控模型优化方法、终端及计算机可读存储介质在审
申请号: | 201810045705.3 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108280759A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 周南;潘丽妃;曾理;李孚煜;罗伟东 | 申请(专利权)人: | 深圳市和讯华谷信息技术有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 安娜 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风控 特征因子 多维度数据 模型优化 计算机可读存储介质 终端 监控过程 生成处理 算法 预设 筛选 概率 审核 预测 优化 | ||
本发明实施例公开了一种风控模型优化方法、终端及计算机可读存储介质,其中方法包括:获取多维度数据;对多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;利用XGBoost算法,对第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;将最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。实施本发明实施例,基于多维度数据实现了风控模型优化,进一步地,基于优化后的风控模型,可以提高贷前审核、贷中监控过程中对用户进行识别的准确性。
技术领域
本发明涉及互联网金融风控技术领域,具体涉及一种风控模型优化方法、终端及计算机可读存储介质。
背景技术
现阶段,互联网金融贷款服务公司,在提供放贷服务过程中,往往只有用户提交申请所填写的数据,以及人行征信数据可用,本身存在数据覆盖少,可用信息少等问题,难以支撑一个用户在贷前审核、贷中监控等关键环节的审查。
发明内容
本发明实施例的目的在于提供一种风控模型优化方法、终端及计算机可读存储介质,以基于多维度数据进行风控模型优化,提高贷前审核、贷中监控过程中对用户进行识别的准确性。
为实现上述目的,第一方面,本发明实施例提供了一种风控模型优化方法,包括:
获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以及用户设备基础信息数据;
对所述多维度数据进行处理,以得到第一风控特征因子、第二风控特征因子以及第三风控特征因子;
利用XGBoost算法,对所述第一风控特征因子、第二风控特征因子以及第三风控特征因子进行筛选及生成处理,以得到最有效风控特征因子和组合风控特征因子;
将所述最有效风控特征因子和组合风控特征因子输入预设的风控模型,以预测用户逾期概率值。
作为本申请一种优选的实施方式,对所述多维度数据进行处理,以得到第一风控特征因子具体包括:
利用Naive Bayes算法对所述应用类别数据进行分类,以得到多个应用类别;
根据所述应用类别,结合所述用户使用行为数据,利用LR算法计算出每一用户对每一类使用行为的的行为偏好;
将所述行为偏好作为所述第一风控特征因子。
作为本申请一种优选的实施方式,对所述多维度数据进行处理,以得到第二风控特征因子具体包括:
利用GeoHash技术,结合所述用户设备地理位置轨迹数据,计算算用户设备任一时间段所处地点的地理类型;
将所述地理类型作为所述第二风控特征因子。
作为本申请一种优选的实施方式,所述用户设备基础信息数据包括国际移动设备身份码、MAC地址及国际移动用户识别码,对所述多维度数据进行处理,以得到第三风控特征因子具体包括:
利用图算法,结合所述用户设备基础信息数据获取多个用户设备的关联数据;
将所述关联数据作为所述第三风控特征因子。
作为本申请一种优选的实施方式,所述优化方法还包括:
根据所述用户逾期概率值和预设的测试样本集中用户的好坏标识得到ks指标值。
第二方面,本发明实施例提供了一种风控模型优化终端,包括:
获取单元,用于获取多维度数据,所述多维度数据包括应用类别数据、用户使用行为数据、用户设备地理位置轨迹数据以及用户设备基础信息数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市和讯华谷信息技术有限公司,未经深圳市和讯华谷信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810045705.3/2.html,转载请声明来源钻瓜专利网。