[发明专利]评分卡模型训练方法、装置、存储介质及电子装置在审
申请号: | 202011296435.7 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112330048A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 胡振禹;史晨阳;王青林;王磊;卜广庆;王瑜;韩海英;郭皓;邹华;程一鸣;詹俊杰;田江;李琨;额日和 | 申请(专利权)人: | 中国光大银行股份有限公司;光大科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06N20/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 刘旺贵 |
地址: | 100033 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评分 模型 训练 方法 装置 存储 介质 电子 | ||
本发明实施例提供了一种评分卡模型训练方法、装置、存储介质及电子装置,该方法包括:将数据宽表中的连续变量进行分箱得到离散的变量;将该变量输入带约束的逻辑回归模型中,将该逻辑回归模型转换为评分卡模型,并计算该评分卡模型的补偿和刻度,其中,该逻辑回归模型的约束条件是限制该变量系数的下界为非负。通过本发明,由于限制逻辑回归模型中变量系数的下界为非负,解决了相关技术中评分卡模型在使用逻辑回归算法训练模型时自变量间存在多重共线的关系而导致个别变量系数为负,进而导致模型失去原有的解释力的问题,进而达到了避免多次模型迭代、减少模型训练的时间成本和训练开销的效果。
技术领域
本发明实施例涉及信息交互技术领域,具体而言,涉及一种评分卡模型训练方法、装置、存储介质及电子装置。
背景技术
评分卡模型是在具体场景中以分数衡量风险几率的一种方法,通常在信用贷款的风控业务中广泛使用,建模原理为将模型自变量通过证据权重(Weight Of Evidence,WOE)编码方式离散化之后,运用逻辑回归算法对二分类问题进行建模,拟合出变量对应的系数。
联邦机器学习是一种新兴的人工智能基础技术,能有效帮助多个机构在满足用户隐私保护、数据安全及合规的要求下,进行数据使用和机器学习建模。
传统逻辑回归模型系数的值可正可负,当值为负数时,该变量的趋势与单变量分析时的趋势相反,模型为线性模型,当得到模型的系数后,将逻辑回归模型预测的概率根据设定的分值刻度转化为分数。在传统逻辑回归模型下,系数出现负值时,一般认为模型不具有可解释性,需要重现选择变量并建模,直到模型具有可解释性为止。
相关的评分卡模型在用逻辑回归算法训练模型时,并不能保证拟合出的系数均为非负,由于自变量间存在多重共线的关系,很可能导致个别变量系数为负,导致模型失去了原有的解释性。
针对相关技术中评分卡模型在使用逻辑回归算法训练模型时自变量间存在多重共线的关系而导致个别变量系数为负,进而导致模型失去原有的解释力的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种评分卡模型训练方法、装置、存储介质及电子装置,以至少解决相关技术中评分卡模型在使用逻辑回归算法训练模型时自变量间存在多重共线的关系而导致个别变量系数为负,进而导致模型失去原有的解释力的问题。
根据本发明的一个实施例,提供了一种评分卡模型训练方法,包括:将数据宽表中的连续变量进行分箱得到离散的变量;将所述变量输入带约束的逻辑回归模型中,将所述逻辑回归模型转换为评分卡模型,并计算所述评分卡模型的补偿和刻度,其中,所述逻辑回归模型的约束条件是限制所述变量系数的下界为非负。
在一个示例性实施例中,将所述变量输入带约束的逻辑回归模型中,将所述逻辑回归模型转换为评分卡模型,并计算所述评分卡模型的补偿和刻度,可以包括:第一数据机构和第二数据机构进行信息交互,根据带约束的所述逻辑回归模型确定第一数据宽表中变量的第一模型权值和第二数据宽表中变量的第二模型权值,其中,所述逻辑回归模型的约束条件是限制所述变量系数的下界为非负;所述第一数据机构和所述第二数据机构分别将根据所述第一模型权值计算出的第一梯度值、所述第二模型权值计算出的第二梯度值和损失发送至第三方机构;所述第三方机构根据所述第一梯度值、第二梯度值和损失更新所述第一模型权值和所述第二模型权值,并将经过更新后满足停止条件的所述第一模型权值和经过更新后满足停止条件的所述第二模型权值分别发送至所述第一数据机构和所述第二数据机构;所述第一数据机构和所述第二数据机构分别根据经过更新后满足停止条件的所述第一模型权值和经过更新后满足停止条件的所述第二模型权值计算得出第一评分卡模型的补偿和刻度以及第二评分卡模型的补偿和刻度。
在一个示例性实施例中,在第一数据机构和第二数据机构进行信息交互之前,还可以包括:所述第一数据机构和所述第二数据机构接收所述第三方机构发送的公钥。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国光大银行股份有限公司;光大科技有限公司,未经中国光大银行股份有限公司;光大科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011296435.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理