[发明专利]一种风险评估方法及装置有效
申请号: | 201911006993.2 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110751400B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 马子俊 | 申请(专利权)人: | 宜人恒业科技发展(北京)有限公司;普信恒业科技发展(北京)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 100022 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 风险 评估 方法 装置 | ||
本发明提供了一种风险评估方法及装置,该方法包括:根据数据的风险信息量对数据源进行分组,得到包括强相关变量的强相关变量组和包括弱相关变量的弱相关变量组;依据所述弱相关变量组构建第一风险评估模型;利用所述第一风险评估模型对仅包含所述弱相关变量的全量样本进行预测概率分类,得到负样本比例最高的样本组;依据所述负样本比例最高的样本组和所述强相关变量组构建第二风险评估模型;利用所述第一风险评估模型和所述第二风险评估模型进行风险评估。本发明解决了由正负样本不均衡导致模型预测效率不高的问题,提高了风险评估模型的预测效率。
技术领域
本发明涉及风险控制技术领域,更具体的,涉及一种风险评估方法及装置。
背景技术
风险评估是对风险的量化,是风险管理的关键性技术。目前一般通过建模的方式进行风险评估,在模型的建立过程中,主要有数据抽取、特征生成、特征选取、算法模型生成和合理性评估等步骤。
随着数据的来源渠道越来越丰富,可以作为风险特征变量的数据字段也越来越多。由于不是所有样本中的所有风险特征字段均为有效数值,因此,空缺值的出现不可避免,并且随着特征字段的增多,缺失情况会朝着越来越严重的方向发展。
当数据普遍稀疏,即风险特征字段空缺值较多时,如果按照传统的模型手段去进行特征挑选以及进行后续建模过程,模型预测的效率较低,当利用模型进行风险评估时,风险评估的准确性较低。
发明内容
有鉴于此,本发明提供了一种风险评估方法及装置,以提高模型的预测效率。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种风险评估方法,包括:
根据数据的风险信息量对数据源进行分组,得到包括强相关变量的强相关变量组和包括弱相关变量的弱相关变量组;
依据所述弱相关变量组构建第一风险评估模型;
利用所述第一风险评估模型对仅包含所述弱相关变量的全量样本进行预测概率分类,得到负样本比例最高的样本组;
依据所述负样本比例最高的样本组和所述强相关变量组构建第二风险评估模型;
利用所述第一风险评估模型和所述第二风险评估模型进行风险评估。
可选的,在所述依据所述弱相关变量组构建第一风险评估模型之前,所述方法还包括:
分别对所述强相关变量组和所述弱相关变量组进行降噪处理。
可选的,所述利用所述第一风险评估模型对仅包含所述弱相关变量的全量样本进行预测概率分类,得到负样本比例最高的样本组,包括:
利用所述第一风险评估模型对仅包含所述弱相关变量的全量样本进行预测概率分类,得到仅包含所述弱相关变量的全量样本中每个样本为负样本的概率;
依据预先设定的分割点以及仅包含所述弱相关变量的全量样本中每个样本为负样本的概率,将仅包含所述弱相关变量的全量样本划分为所述负样本比例最高的样本组和负样本比例最低的样本组。
可选的,所述方法还包括:
以正样本和负样本的预测准确率最高为优化目标,采用预设优化算法,计算所述分割点的最优值。
可选的,所述利用所述第一风险评估模型和所述第二风险评估模型进行风险评估,包括:
利用所述第一风险评估模型进行风险评估,得到第一风险评估值;
利用所述第二风险评估模型进行风险评估,得到第二风险评估值;
将所述第一风险评估值和所述第二风险评估值中的最大值确定为最终风险评估值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宜人恒业科技发展(北京)有限公司;普信恒业科技发展(北京)有限公司,未经宜人恒业科技发展(北京)有限公司;普信恒业科技发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911006993.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:地震危险性并行分析方法、装置及设备
- 下一篇:一种丽蚜小蜂蜂卡质量的评价方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理