[发明专利]一种基于债券估值数据与集成机器学习的债券违约预测方法有效
申请号: | 202010138315.8 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111340236B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 殷宪晨 | 申请(专利权)人: | 中债金融估值中心有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q40/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200122 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 债券 数据 集成 机器 学习 违约 预测 方法 | ||
本发明提供一种基于债券估值数据与集成机器学习的债券违约预测方法,包括以下步骤:(1)获取债券估值数据和基本资料数据;(2)特征工程,清洗数据;(3)K折交叉验证选择最优模型参数;(4)训练模型;(5)使用训练好的模型进行违约预测;(6)集成模型,得到风险评分。其通过使用结构化的债券估值数据进行违约预测,降低使用非结构化数据的处理复杂度,增强所用数据与债券的相关性;通过运用K折交叉验证选择最优的模型参数,避免人为选参造成的模型效果差的问题;通过集成多个不同特点的模型的预测结果,降低只用个别模型预测产生错误的概率;通过给出不同模型预测的违约概率和集成的风险评分,辅助投资者进行投资决策。
技术领域
本发明属于金融风险评估领域,具体涉及一种基于债券估值数据与集成机器学习的债券违约预测方法。
背景技术
债券作为投资者重要的融资工具,连续爆发的违约事件损害了投资者的利益,影响了债券市场融资功能的发挥。为了更好地维护投资者的利益,保护投资者合法权益,需要一种能够提前预测债券违约风险的方法,在债券违约前预警,以辅助投资者进行债券投资决策,避免财产遭受严重损失。
到目前为止,市场上已经有一些利用机器学习进行债券违约预测的方法,这些方法主要使用与债券本身无关的数据,例如债券主体相关的财务数据、主体所在行业数据、地区的财政数据、宏观经济数据、市场舆情数据和征信数据等。将这些数据结构化、清洗之后,使用特定参数的机器学习模型进行训练,最后对新债券是否违约进行预测。
这些方法主要使用和债券本身无关的非结构化数据,这些数据和债券的特征没有直接联系,而且需要花费大量的时间成本和人力成本将非结构化数据处理成机器学习模型可用的结构化数据。此外人为选择机器学习模型的参数,不恰当的选择会严重影响模型的效果,降低预测结果的准确性。这些方法通常只用一个模型进行训练预测,由于数据分布具有很大的不确定性,一个模型只能拟合一部分数据的分布特性,另外一部分数据拟合程度差,往往导致预测准确性降低。
发明内容
为了解决现有方法的不足,本发明提供一种基于债券估值数据与集成机器学习的债券违约预测方法,本方法首次将债券的估值数据应用在债券违约预测中,使用公司估值中心编制的为金融资产提供公允价值的债券估值数据和债券发行时的基本资料数据预测债券违约风险;通过K折交叉验证选择模型参数,避免了人为选择参数造成的模型效果差的问题;集成多个不同特点的机器学习模型进行债券风险评分,降低了只使用一个模型进行债券违约预测产生错误的概率。
为实现上述目的,本发明的技术方案如下:
一种基于债券估值数据与集成机器学习的债券违约预测方法,包括以下步骤:
(1)获取债券估值数据和基本资料数据。
(2)特征工程,清洗数据。
(3)K折交叉验证选择最优模型参数。
(4)训练模型。
(5)使用训练好的模型进行违约预测。
(6)集成模型,得到风险评分。
步骤(1)中,从中债金融估值中心获取正常到期债券和违约债券的估值数据和基本资料数据,这些数据称为训练样本集合,正常到期债券样本为正样本,违约债券样本为负样本。样本的特征包括类别特征和数值特征,类别特征包括:证券类型代码、证券品种代码、证券类别代码、证券性质代码、证券期限单位、计息方式代码、担保方式代码、含权标志、城投债标志、付息规则标志、机构类型代码、组织形式、是否上市、地区代码、行业代码、最新主体信用评级编号、最新债项信用评级编号和曲线评级编号,数值特征包括:证券期限、票面利率、发行时利差、付息频率、发行价格、实际发行总额、本期本金值、注册资本、修正久期、凸性、基点价值、估值全价、估值净价、估价收益率、实际待偿期和上一个工作日净价离差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中债金融估值中心有限公司,未经中债金融估值中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010138315.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置