[发明专利]信用评分模型训练方法、评分方法及系统、设备及介质有效
申请号: | 202011106825.3 | 申请日: | 2020-10-16 |
公开(公告)号: | CN112017040B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 孙战平 | 申请(专利权)人: | 银联商务股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 汪源 |
地址: | 200135 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用 评分 模型 训练 方法 系统 设备 介质 | ||
本发明实施例提供了一种企业信用评分模型的训练方法及其系统、电子设备及存储介质。本发明实施例提供的企业信用评分模型的训练方法,通过从多个维度出发,建立多个子评估模型,然后对评分模型进行训练,当采用训练后的评分模型进行企业信用评分时,可以结合多种业务场景综合对企业信用进行评估,避免了过分依赖某一项信用记录,提高了企业信用评分模型的训练方法的准确性,另外,建立多个子评估模型,可以结合多种业务场景对企业的各维度资质进行评估,提高了企业信用评分方法的灵活性。
技术领域
本发明涉及金融技术领域,尤其涉及信用评分模型训练方法、评分方法及系统、设备及介质。
背景技术
近年来,随着普惠金融的深入,企业信贷业务得到了快速发展。尤其是小微企业信贷市场规模庞大,但是小微企业经营管理不规范、信息化程度低、信用担保体系不完善等问题加大了信用评估难度及成本,使得小微企业仍然面临“融资难、融资贵”的难题,为了降低借贷双方信息不对称程度,加快审批效率,目前已有为大中型企业进行信用评级的方法,但是对小微企业的信用评估方法较少,目前已有的对小微企业的信用评分方法过度依赖互联网数据,数据真实性存疑(数据通过网络爬虫等方式获取,真实性未经核实);且在对小微企业的信用评级时,未考虑到小微企业所属的行业、企业的交易等维度进行风险识别,从而使得对小微企业的信用评级可信度差,加大了对小微企业的信用评级难度。
发明内容
有鉴于此,本发明实施例提供了一种企业信用评分模型的训练方法、企业信用评分方法及其系统、电子设备及存储介质。通过从多个维度出发,建立多个子评估模型,可以结合多种业务场景综合对企业的信用进行评估,提高了企业信用评分的灵活性以及准确性。
作为本发明实施例的一方面, 本发明实施例提供一种企业信用评分模型的训练方法,包括:对原样本数据集进行预处理,生成新样本数据集,所述新样本数据集的数据格式符合逻辑回归算法的格式要求;将所述新样本数据集划分为训练数据集以及测试数据集;构建五个子模型;将所述训练数据集中的连续变量按照预设对应关系分别输入至每个子模型中进行逻辑回归,计算每个所述子模型的评分规则;获取每个所述子模型的权重;以及根据每个所述子模型的权重以及每个所述子模型的评分规则,计算所述评分模型的评分规则;其中,所述原样本数据集包括五类子样本数据集,所述五类子样本数据分别一一对应所述五个子模型。
在本发明一实施例中,所述五类子样本数据集包括为:企业经营信息子样本数据集、企业身份信息子样本数据集、企业风险信息子样本数据集、企业历史信用信息子样本数据集以及企业法人信息子样本数据集;所述五个子模型包括:企业经营信息子模型、企业身份信息子模型、企业风险信息子模型、企业历史信用子模型以及企业法人信息子模型。
在本发明一实施例中,所述企业经营信息子样本数据集包括同行业内企业所在地的交易排名。
在本发明一实施例中,所述对原样本数据进行预处理进一步包括:对所述原样本数据集中的原样本数据进行清洗,获取清洗后的样本数据集;将所述清洗后的样本数据集分类为多个连续变量以及多个名义变量;对所述多个连续变量一一进行分箱处理,生成每个所述连续变量的信息值;以及对所述多个名义变量进行降维处理,生成新名义变量;其中,所述新样本数据集包括所述多个连续变量、每个所述连续变量的信息值以及所述新名义变量。
在本发明一实施例中,所述对所述原样本数据集中的原样本数据进行清洗进一步包括: 对所述原样本数据集中的每组数据进行识别,判断所述每组数据中的每个类别的数据值是否缺失,当第一组数据中第一类别的数据值缺失时,将所述第一组数据中的所述第一类别的数据值采用第一数值代替;或对所述原样本数据中的每组数据进行识别,判断所述每组数据中的每个类别的数据值是否异常,当第二组数据中第二类别的数据值存在异常时,将所述第二组数据剔除。
在本发明一实施例中,所述将所述新样本数据集划分为训练数据集以及测试数据集进一步包括:对所述新样本数据集进行上采样处理,生成标准样本数据;以及将所述标准样本数据分为训练数据集以及测试数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银联商务股份有限公司,未经银联商务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011106825.3/2.html,转载请声明来源钻瓜专利网。