[发明专利]信用评分值的确定方法及其装置、电子设备及存储介质在审
申请号: | 202210017882.7 | 申请日: | 2022-01-07 |
公开(公告)号: | CN114372871A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 相妹 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用 评分 确定 方法 及其 装置 电子设备 存储 介质 | ||
本发明公开了一种信用评分值的确定方法及其装置、电子设备及存储介质,涉及机器学习领域,其中,该确定方法包括:基于目标账户的账户标识,获取目标账户的多个账户特征,得到特征集合,将特征集合输入至预先训练的联邦学习模型,得到每个账户特征的参数值,对每个账户特征进行权重编码,得到账户特征所属的特征分箱的证据权重值,基于每个账户特征的参数值以及账户特征所属的特征分箱的证据权重值,确定目标账户在当前评分机构的信用评分值。本发明解决了相关技术中通过获取多个机构的数据来共同训练客户信用评分模型,提升评分准确率的方式,无法保证客户数据隐私的安全的技术问题。
技术领域
本发明涉及机器学习领域,具体而言,涉及一种信用评分值的确定方法及其装置、电子设备及存储介质。
背景技术
在金融业务场景中,评分卡是一种以分值的方式来衡量一个客户的信用风险大小的手段,为业务申请审批提供决策依据。一般来说,客户的评分卡的分数越高,表示该客户的信用越好,风险也就越小。
相关技术中,评分卡模型通常基于逻辑回归(Logistic Regression,LR)算法,该算法具备良好的可解释性和鲁棒性,并且易于监测和部署。然而,仅仅采用基于逻辑回归算法搭建的模型进行客户的信用评分计算,其模型准确率很难提高。在实际应用中,如果想要进一步提升模型准确率,可以采用以下两种方式实现:(1)选择比LR算法更加复杂的决策树或者神经网络等算法,但由于复杂算法的可解释性不佳,很难在实际场景中落地应用;(2)通过补充更丰富的数据源来训练模型,例如,银行数据、互联网类数据、运营商类数据或者政务类数据等共同使用,但是,通过补充数据源来提高模型准确率,需要采用多个机构的数据共同训练,涉及到隐私数据安全问题,无法保证客户数据隐私的安全。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种信用评分值的确定方法及其装置、电子设备及存储介质,以至少解决相关技术中通过获取多个机构的数据来共同训练客户信用评分模型,提升评分准确率的方式,无法保证客户数据隐私的安全的技术问题。
根据本发明实施例的一个方面,提供了一种信用评分值的确定方法,包括:基于目标账户的账户标识,获取所述目标账户的多个账户特征,得到特征集合,其中,每个所述账户特征对应一个特征值,对多个所述特征值进行分箱处理,得到多个特征分箱;将所述特征集合输入至预先训练的联邦学习模型,得到每个所述账户特征的参数值;对每个所述账户特征进行权重编码,得到所述账户特征所属的特征分箱的证据权重值;基于每个所述账户特征的参数值以及所述账户特征所属的特征分箱的证据权重值,确定所述目标账户在当前评分机构的信用评分值。
可选地,在基于目标账户的账户标识,获取所述目标账户的多个账户特征之前,所述确定方法包括:获取多个评分机构的样本数据集,其中,每个所述样本数据集至少包括:账户特征,至少一个样本数据集还包括:样本标签;对所述样本数据集进行预处理,并将预处理后的所述样本数据集中的账户特征进行分箱处理,得到多个特征分箱;基于所述多个特征分箱,计算每个所述特征分箱的证据权重值WOE,并基于所述证据权重值,计算每个所述账户特征的信息值IV;基于所述信息值,筛选大于等于预设价值阈值的信息值所对应的账户特征,得到筛选出的账户特征集合;基于预设逻辑回归模型,拟合所述账户特征集合中每个账户特征的特征参数,以完成对所述联邦学习模型的训练任务。
可选地,在所述样本数据集包括样本标签的情况下,将预处理后的所述样本数据集中的账户特征进行分箱处理,得到多个特征分箱的步骤,包括:获取每个所述账户特征的特征值,并对所述特征值进行排序处理,得到排序结果;基于预设分箱策略,对所述排序结果中所述特征值进行分箱处理,得到多个特征分箱。
可选地,在将预处理后的所述样本数据集中的账户特征进行分箱处理,得到多个特征分箱之后,所述确定方法还包括:计算每两个相邻的特征分箱的卡方值;将最小卡方值所指示的相邻特征分箱合并为一个特征分箱;返回计算每两个相邻的特征分箱的卡方值的步骤,直至所述卡方值大于预设阈值或者分箱数量等于分析数量阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210017882.7/2.html,转载请声明来源钻瓜专利网。