[发明专利]一种数据特征重要性的分析方法及系统在审

专利信息
申请号: 202010464925.7 申请日: 2020-05-28
公开(公告)号: CN111612624A 公开(公告)日: 2020-09-01
发明(设计)人: 吴凌坤 申请(专利权)人: 深圳博普科技有限公司
主分类号: G06Q40/04 分类号: G06Q40/04;G06Q10/06;G06N3/00
代理公司: 深圳市智胜联合知识产权代理有限公司 44368 代理人: 齐文剑
地址: 518000 广东省深圳市福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 特征 重要性 分析 方法 系统
【说明书】:

发明实施例提供了一种数据特征重要性的分析方法及系统,其中一种数据特征重要性的分析方法包括:获取债券风险评估所需的债券样本,并标记出债券样本中样本点的时间粒度,将其作为原始数据集;对所述原始数据集进行预处理,获取均衡数据集;构建用于分析数据特征重要性的随机森林模型;将所述均衡数据集输入进所述随机森林中进行计算,分析出各个数据特征的重要性排名。在收集了与债券风险评估有关的原始数据集后,通过预处理对原始数据集进行数据均衡化,以解决因数据中正负样本比例不均,而导致无法对数据特征进行有效分析的问题,并且采用随机森林算法对均衡化后的数据进行相应的数据特征分析,以找出比经由传统评估方法总结下来的用于评估债券风险所需的更加科学和准确的相关数据特征。

技术领域

本发明涉及数据处理技术领域,特别是涉及一种数据特征重要性的分析方法及系统。

背景技术

近两年来,随着政策的变更债券违约事件频繁发生,且可以预见债券违约将会成为常见的风险事件。

而现在对债券进行风险评估的传统方式,是由人工对评估对象的经营状况、财务状况以及所属行业行情等相关数据进行收集,并通过总结得来的经验,对这些数据中的数据特征进行分析,从而评估出债券的风险性。

但是由于近几年政策变更频繁,导致出现了很多过去没有或甚少出现过的债券风险案例,这使得根据人工总结下来的,用来分析债券风险性的数据特征变得不再可靠。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据特征重要性的分析方法和相应的一种数据特征重要性的分析系统。

为了解决上述问题,本发明实施例公开了一种数据特征重要性的分析方法,包括:

获取债券风险评估所需的债券样本,并标记出债券样本中样本点的时间粒度,将其作为原始数据集;

对所述原始数据集进行预处理,获取均衡数据集;

构建用于分析数据特征重要性的随机森林模型;

将所述均衡数据集输入进所述随机森林中进行计算,分析出各个数据特征的重要性排名。

进一步地,所述债券风险评估所需的债券样本,具体为:

所述债券样本的样本点以季度为时间粒度;

所述债券样本的样本点,具体为:

按照所述样本点所对应的债券在季度中以是否发生过违约情况或重大风险事件为标准,从而标记出正负样本。

进一步地,所述正负样本,具体为:

当此债券在季度中发生过违约情况或重大风险事件时,标记为负样本;

当此债券在季度中未发生过违约情况或重大风险事件时,标记为正样本。

进一步地,所述对所述原始数据集进行预处理包括欠采样和过采样两种方法。

进一步地,所述随机森林模型,具体为:

利用bootstrap抽样方法从经过所述预处理后的均衡数据集N中有放回地重复随机抽取K个样本生成新的数据样本合集;

根据所述新的数据样本集生成T个分类树组成随机森林;

对每个经过所述bootstrap抽样法得来的样本进行决策树建模,组成多棵决策树进行预测,并通过投票得出最终预测结果。

进一步地,所述决策树,具体为:

每棵决策树由样本量为K的训练样本X和随机向量θk生成;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳博普科技有限公司,未经深圳博普科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010464925.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top