[发明专利]一种基于树模型特征衍生的风险评估方法、装置和电子设备在审
申请号: | 202110142076.8 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112465657A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 姚王照 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06Q10/06;G06N20/00;G06K9/62 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 特征 衍生 风险 评估 方法 装置 电子设备 | ||
本发明公开了一种基于树模型特征衍生的风险评估方法,用于评估用户的金融风险,其特征在于,包括:获取与用户关联的移动终端的应用列表信息并对其进行独热编码,形成与用户关联的独热编码特征;将独热编码特征代入树特征衍生模型以获取与用户关联的独热编码衍生特征;构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型;将新用户的独热编码衍生特征输入训练好的机器学习模型,计算该新用户的风险评分。本发明评估的授信风险结果准确率高,稳定性较好,在建模和特征维护方面,投入的人力少,节省资源,效果显著。
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于树模型特征衍生的风险评估方法、装置、电子设备及计算机可读介质。
背景技术
消费金融领域,在用户充分授权的前提下,对用户的应用程序(APP)数据进行充分挖掘并用以风险控制可以区分出一定比例的高风险用户。目前传统的应用变量挖掘主要是对应用程序进行分类统计,然后刻画用户画像;或者根据不同时期应用程序安装卸载的变化情况来刻画用户的风险变化;或者根据安装的应用程序风险等级来衍生相关的入模变量。上述方法可以衍生出具有一定风险区分度的变量,但是这些方法普遍存在维护难度比较大,投入的人力较多,衍生变量的质量较大程度依赖于挖掘者对业务的了解程度、维护成本高、稳定性不理想等。
发明内容
为了解决在风险评估中存在的上述缺陷进而实现稳定准确高效的评估,本发明提供了一种基于树模型特征衍生的风险评估方法、装置、电子设备及计算机可读介质。
本发明的一个方面提供一种基于树模型特征衍生的风险评估方法,用于评估用户的金融风险,包括:
获取与用户关联的移动终端的应用列表信息并对其进行独热编码,形成与所述用户关联的独热编码特征;
将所述独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征;
构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型;
将新用户的独热编码衍生特征输入所述训练好的机器学习模型,计算该新用户的风险评分。
根据本发明的优选实施方式,所述获取与用户关联的移动终端的应用列表信息并对其进行独热编码,进一步包括:获取多个应用的用户覆盖度;建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值;将用户的用用安装列表与所述应用集合比较以获得所述与用户关联的独热编码特征。
根据本发明的优选实施方式,所述建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值,进一步包括:按照所述用户覆盖度由大到小的顺序对所述多个应用排序形成序列;选取所述序列中排名在前预设数量的应用作为应用集合中的应用。
根据本发明的优选实施方式,根据应用列表信息进行独热编码,形成与所述用户关联的独热编码特征,进一步包括:根据所述应用安装列表信息获得应用安装数量,根据应用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。
根据本发明的优选实施方式,根据应用列表信息进行独热编码,形成与所述用户关联的独热编码特征,进一步包括:根据所述应用安装列表信息获得特定类型的应用安装数量,根据该特定类型的应用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。
根据本发明的优选实施方式,所述将独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征,进一步包括:构建树特征衍生模型;将所述独热编码特征打散并代入所述树特征衍生模型;获取独热编码衍生特征。
根据本发明的优选实施方式,所述树特征衍生模型进一步包括多个树模型构成的组合模型。
根据本发明的优选实施方式,所述树模型为xgboost模型或LightGBM模型。
根据本发明的优选实施方式,所述独热编码衍生特征为一维稀疏向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110142076.8/2.html,转载请声明来源钻瓜专利网。