[发明专利]信用评分模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202110107067.5 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112785420A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 张琛;梁秀钦;陈嘉真 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N20/00 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用 评分 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种信用评分模型的训练方法、装置、电子设备及存储介质,该方法包括:从多个历史用户的原始数据中提取原始数据的第一统计特征数据,第一统计特征数据包括原始数据所属的目标数据类型,确定原始数据在目标数据类型下的第二统计特征数据,根据第一统计特征数据和第二统计特征数据,确定至少一个待选训练的初始机器学习模型,采用第一统计特征数据和第二统计特征数据,训练至少一个初始机器学习模型,得到至少一个目标机器学习模型,从至少一个目标机器学习模型中选择出目标信用评分模型。利用该方法,能够实现更加精确的信用评分预测。
技术领域
本申请涉及信用评估技术领域,特别涉及一种信用评分模型的训练方法、装置、电子设备及存储介质。
背景技术
风险控制是金融领域中的核心基础。当金融机构发放贷款额度的时候,需要知道如何评判一组贷款申请人。其中,利用申请人的个人信用评分进行评判,是一种方便有效的评判方法。个人信用评分是银行或者其他金融机构利用所获得的关于信用申请人的信息,进行风险预测的一种方式和技术,使用个人信用评分可以量化贷款的风险。目前,人们在实际使用中利用个人信用评分得到个人信用分数时,可以使用信用评分模型,模型的输入是申请人的某些信息,比如,最近一年的履约情况、最近一年的支付金额、风险分数等,模型的输出即为申请人的个人信用分数,信用分数越高表示申请人偿还贷款的可能性越大。对于一组申请人,可以按照个人的信用分数做一个排序,来判断优先发放贷款的顺序。
现有技术中,生成信用评分模型的方式可以是使用机器学习方式,把历史申请人的原始数据信息提炼为特征数据得到训练数据集,选取合适的机器学习算法,调整算法参数,训练得到一个信用评分模型,然后对于新的申请人,可以用这个模型来计算个人信用分数。
但是,现有技术中使用机器学习方式生成信用评分模型的方法,当数据变化的时候需要重新选择机器学习算法并重新训练模型,但是由于机器学习算法的类型很多,所以在重新训练模型的时候会面临很多选择,同时,机器学习算法所需要的特征工程比较复杂,耗费人力和时间,因此,使用现有技术的方法,存在处理复杂、效率较低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种信用评分模型的训练方法、装置、电子设备及存储介质,以解决现有技术中进行信用评分时处理复杂、效率低下的问题。
第一方面,本申请实施例提供一种信用评分模型的训练方法,包括:
从多个历史用户的原始数据中提取所述原始数据的第一统计特征数据,所述第一统计特征数据包括:所述原始数据所属的目标数据类型;
确定所述原始数据在所述目标数据类型下的第二统计特征数据;
根据所述第一统计特征数据以及所述第二统计特征数据,确定至少一个待选训练的初始机器学习模型;
采用所述第一统计特征数据以及所述第二统计特征数据,训练所述至少一个初始机器学习模型,得到至少一个目标机器学习模型;
从所述至少一个目标机器学习模型中选择出目标信用评分模型。
作为一种可能的实现方式,所述从多个历史用户的原始数据中提取所述原始数据的第一统计特征数据,包括:
获取所述多个历史用户的至少一个数据维度上的原始数据;
分别从所述多个历史用户的至少一个数据维度上的原始数据中提取所述第一统计特征数据。
作为一种可能的实现方式,所述第一统计特征数据还包括:特征覆盖率、卡方统计量、互信息以及线性相关系数。
作为一种可能的实现方式,所述确定所述原始数据在所述目标数据类型下的第二统计特征数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110107067.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锅具
- 下一篇:一种降落位姿确定方法及电子设备