[发明专利]基于多视图学习的借贷违约风险检测方法及相关设备在审
申请号: | 202011528313.6 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112651821A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 许天歌 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视图 学习 借贷 违约 风险 检测 方法 相关 设备 | ||
1.一种基于多视图学习的借贷违约风险检测方法,应用于借贷平台上,其特征在于,所述方法包括:
将违约检测数据特征划分为借款标的特征视图和借款者特征视图,其中,所述违约检测数据特征为历史标的数据的数据特征;
基于所述借款标的特征视图的有标签样本训练第一检测分类器,基于所述借款者特征视图的有标签样本训练第二检测分类器,并基于训练后的第一检测分类器和第二检测分类器检测拒绝样本的检测标签,以及与所述检测标签对应的标签概率;
将检测标签一致的拒绝样本,作为高置信样本加入候选集,其中,所述候选集中包括有标签样本;
将标签概率作为显式置信度,并根据从所述候选集中获取到的显式置信度高于第一预设值的高置信样本,对所述第一检测分类器和所述第二检测分类器继续训练,直到训练次数达到第二预设值,或者加入到所述候选集中的拒绝样本的比例占所有有标签样本的第三设定值时,训练结束,得到训练好的第一检测分类器和第二检测分类器;
根据预设权重策略为训练好的第一检测分类器和第二检测分类器设定投票权重,得到多视图违约风险检测模型;
将待检测标的数据输入到所述多视图违约风险检测模型中,得到借贷违约风险检测结果。
2.根据权利要求1所述的方法,其特征在于,所述将违约检测数据特征划分为借款标的特征视图和借款者特征视图,包括:
遍历所述历史标的数据的违约检测数据特征,确定各所述违约检测数据特征之间的关联关系,其中,所述关联关系为所述检测数据特征之间的属性相似度;
根据所述属性相似度将所述违约检测数据特征划分为借款标的特征视图和借款者特征视图。
3.根据权利要求1所述的方法,其特征在于,所述将检测标签一致的拒绝样本,作为高置信样本加入候选集,包括:
获取各所述拒绝样本的所有检测标签;
若所述拒绝样本的所有检测标签都为违约或者非违约,则所述拒绝样本的检测标签一致;
若所述拒绝样本的检测标签中既有违约,又有非违约,则所述拒绝样本的检测标签不一致;
将所述检测标签一致的拒绝样本作为高置信样本加入所述候选集。
4.根据权利要求1所述的方法,其特征在于,所述将标签概率作为显式置信度,并根据从所述候选集中获取到的显式置信度高于第一预设值的高置信样本,对所述第一检测分类器和所述第二检测分类器继续训练,包括:
从所述候选集中获取所述显式置信度大于0.5,且小于1的高置信样本;
将获取到的高置信样本从所述候选集中的拒绝样本中剔除,并将剔除的高置信样本加入到有标签样本中对所述第一检测分类器和所述第二检测分类器继续进行训练。
5.根据权利要求4所述的方法,其特征在于,所述根据剔除的高置信样本对所述第一检测分类器和所述第二检测分类器继续进行训练,包括:
通过逻辑回归算法计算有标签样本的检测标签为违约或者非违约的检测概率,其中,所述逻辑回归算法包括需要进行拟合的拟合参数;
以损失函数作为目标函数,并计算所述损失函数的损失值;
基于极大似然估计值,通过梯度下降法调整所述拟合参数,得到调整拟合参数后的逻辑回归算法。
6.根据权利要求1所述的方法,其特征在于,所述根据预设权重策略为训练好的第一检测分类器和第二检测分类器设定投票权重,得到多视图违约风险检测模型,包括:
分别为所述第一检测分类器和所述第二检测分类器设定0.5的投票权重,得到所述多视图违约风险检测模型。
7.根据权利要求1所述的方法,其特征在于,所述待检测标的数据存储于区块链中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011528313.6/1.html,转载请声明来源钻瓜专利网。