[发明专利]基于多视图学习的借贷违约风险检测方法及相关设备在审
申请号: | 202011528313.6 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112651821A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 许天歌 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视图 学习 借贷 违约 风险 检测 方法 相关 设备 | ||
本申请实施例属于大数据领域,涉及一种基于多视图学习的借贷违约风险检测方法,包括将违约检测数据特征划分为借款标的特征视图和借款者特征视图;基于有标签样本和拒绝样本训练第一检测分类器和第二检测分类器,得到训练好的第一检测分类器和第二检测分类器;根据预设权重策略为训练好的第一检测分类器和第二检测分类器设定投票权重,得到多视图违约风险检测模型;将待检测标的数据输入到所述多视图违约风险检测模型中,得到借贷违约风险检测结果。采用本方法提高了借贷违约风险检测准确度。
技术领域
本申请涉及数据处理领域,特别是涉及一种基于多视图学习的借贷违约风险检测方法、装置、计算机设备和存储介质。
背景技术
在P2P平台上,借款者发布借款标的的申请,投资者可以根据自己的风险偏好选择满意的标的进行投资,若能在标的的筹备期内筹齐所需的借款总额,则该标的中标,即借款成功,这部分样本也被称为接收样本。P2P平台可以记录这些借款成功客户的后续还款信息。若在标的筹集期内未能筹齐借款总额,则该标的流标,即借款失败,这部分样本也被称为拒绝样本。
基于样本的还款信息,可以标注样本的标签是“违约”还是“非违约”。由于拒绝样本在申请时被拒绝了,没有后续还款信息,因此无法标注拒绝样本的标签是“违约”还是“非违约”,所以在传统的违约风险检测中,通常只使用接受样本(有标签样本)建模。但是由于模型的应用对象是包括接受和拒绝的全部客户,导致模型构建存在着样本选择偏差问题,即训练模型的样本和模型检测的样本分布不一致。利用有偏样本训练违约风险检测模型,将会伤害模型的泛化能力,从而影响到违约风险检测效果。此外,P2P平台中的拒绝样本的比例通常高于70%,当中含有大量的违约特质,拿给模型学习,可以帮助违约风险检测,具有一定的违约风险检测潜力,交给模型学习可以提高模型的违约风险识别能力。随着训练样本量的增加,模型的泛化能力会增强。
目前已有的拒绝推断方式通常分为两类:第一类仅使用中标样本,即有标签样本构建违约风险评价模型,然后利用被拒绝的无标签样本校正模型中有偏参数,代表方式有Heckman两阶段模型,该类方式由于分布存在较大面积平坦区,平坦区表示对参数识别的弱有效性,从而使得其对违约风险评价模型的改善非常有限。第二类方式首先通过推断拒绝样本的标签来构造接近申请样本分布的总体样本,然后给予总提成样本训练违约风险检测模型;代表方式有扩张法、外推法、经验似然估计法、期望最大化(EM)算法、贝叶斯界定折叠法(BC)以及打包法等等。但是第二类方式对拒绝样本的推断过程和违约风险评估过程相互独立,可能会引入噪音数据(错误标记样本),从而伤害模型的性能。
发明内容
基于此,针对上述技术问题,本申请提供一种基于多视图学习的借贷违约风险检测方法、装置、计算机设备及存储介质,以解决现有技术中P2P平台中无法利用无标签的拒绝样本矫正样本选择偏差来挖掘违约风险检测潜力、提高违约检测效果是需要解决的技术问题。
一种基于多视图学习的借贷违约风险检测方法,所述方法包括:
将违约检测数据特征划分为借款标的特征视图和借款者特征视图,其中,所述违约检测数据特征为历史标的数据的数据特征;
基于所述借款标的特征视图的有标签样本训练第一检测分类器,基于所述借款者特征视图的有标签样本训练第二检测分类器,并基于训练后的第一检测分类器和第二检测分类器检测拒绝样本的检测标签,以及与所述检测标签对应的标签概率;
将检测标签一致的拒绝样本,作为高置信样本加入候选集,其中,所述候选集中包括有标签样本;
将标签概率作为显式置信度,并根据从所述候选集中获取到的显式置信度高于第一预设值的高置信样本,对所述第一检测分类器和所述第二检测分类器继续训练,直到训练次数达到第二预设值,或者加入到所述候选集中的拒绝样本的比例占所有有标签样本的第三设定值时,训练结束,得到训练好的第一检测分类器和第二检测分类器;
根据预设权重策略为训练好的第一检测分类器和第二检测分类器设定投票权重,得到多视图违约风险检测模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011528313.6/2.html,转载请声明来源钻瓜专利网。