[发明专利]风控模型建模、企业风险评估方法、装置和存储介质在审
申请号: | 201811445099.0 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109657931A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 张翔;刘媛源;郑子欧;于修铭;汪伟;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王宁 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评分模型 数据集 异常检验 风控 验证数据 负样本 正样本 存储介质 模型建模 机器学习模型 企业风险评估 计算机设备 结果误差 训练条件 样本特征 准确率 申请 | ||
本申请涉及一种风控模型建模方法、装置、计算机设备和存储介质,获取正样本数据集和负样本数据集、验证数据集,将验证数据集、正样本数据集和负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型,将验证数据集、正样本数据集和负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将企业评分模型与异常检验评分模型结合,获得风控模型,企业评分模型结合异常检验评分模型进行企业风险评分降低结果误差,进一步提高了风控模型准确率和稳定性。
技术领域
本申请涉及互联网技术领域,特别是涉及一种风控模型建模、企业风险评估方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的不断发展,根据业务需要,需要对有意向成为合作关系的企业进行企业风险判断,以免造成不必要的损失,由人工收集企业相关的信息转换为利用互联网技术收集数据,根据用户经验判断企业风险改为风控模型进行企业风险评估。
目前风控建模一般使用传统的机器学习方法,例如使用逻辑回归模型建立评分卡。这种有监督学习方法是基于历史数据的负样本学习而来的,且需要较为均衡的已知标签的正负样本。正负样本的需要相关的获取途径获得,如:根据与客户之间的交易过程中获取,但在进行交易前,风控系统会基于对客户的风险判断,决定是否与该客户交易,当该客户为高危客户时,会拒绝与该客户交易,因为被拒绝的客户了往往没有了标签,导致训练样本的分布与现实数据的分布有较大差异,因此导致建立的风控模型准确率和稳定性不高。
发明内容
基于此,有必要针对上述技术问题,提供一种提高风控模型准确率和稳定性的风控模型建模、企业风险评估方法、装置、计算机设备和存储介质。
一种风控模型建模方法,包括:
获取正样本数据集、负样本数据集和验证数据集;
将所述验证数据集、所述正样本数据集和所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型;
将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;
将所述企业评分模型与异常检验评分模型结合,获得风控模型。
在其中一个实施例中,将所述验证数据集、所述正样本数据集与所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型的步骤,包括:
将所述正样本数据集与所述负样本数据集输入待训练的机器学习模型;
所述待训练的机器学习模型基于所述正样本数据集与所述负样本数据集,根据相应的数据特征向量,获得训练后的机器学习模型;
将所述验证数据集输入所述训练后的机器学习模型进行评分,获得企业风险评分;
当所述企业风险评分在预设范围内,满足训练条件,获得企业评分模型。
在其中一个实施例中,将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型的步骤,包括:
将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征进行特征提取,获得各样本特征的特征向量;
将各所述特征向量进行聚类,获得各群簇;
根据各群簇的特征空间分布,确定出各群簇中贡献最大的样本特征;
将贡献度最大的样本特征作为风控模型的评估特征,获得异常检验评分模型。
在其中一个实施例中,将所述企业评分模型与异常检验评分模型结合,获得风控模型的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811445099.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理