[发明专利]一种基于机器学习模型算法的债券违约预警识别技术在审
申请号: | 202110084228.3 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112767172A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 陈毓敏;余哲;张宇阳;李绪生;黄骏 | 申请(专利权)人: | 上海析鲸信息科技有限公司 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433 上海市杨浦区四*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 模型 算法 债券 违约 预警 识别 技术 | ||
1.一种基于机器学习模型算法的债券违约预警识别技术,其特征在于如下步骤:
A1:数据处理,包括读取数据、预定义字典和特征工程,将所获得的发债企业过去每季财务数据以及其行业类别、所属区域等标签送入模型,进行数据预处理,删除缺失较为严重的特征变量后,对数据进行规则化的缺失值填充,然后进行特征工程;
A2:模型训练,包括对A1中处理的数据进行切分,然后预训练多个模型,获取最优参数后,做模型融合,将不同特征变量进行不同操作,如线性变化、非线性变化、等频分箱、不等频分箱等,非标数据进行Onehot(独热)编码处理等,数据处理完毕后将处理好的数据放入模型训练,通过降采样和升采样技术解决违约企业样本和正常企业样本不平衡的问题,设置白名单来解决噪音数据问题,并运用贝叶斯调参自动调整相关超参数,进而得到训练好的最优模型,运用在实际数据中。
2.根据权利要求1所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:所述步骤A1中,数据读取包括,读取公司数据,剔除其他数据,只获取产业类企业的相关公司数据,根据先验概率以及特征相关性,人为选择特征,并将企业性质和二级分类重新分类,将城投等企业剔除出去,删除缺失严重的数据,除评级外,某项特征缺失的数据剔除,读取违约的公司和所有的财报数据,缺失特征数目大于12的数据删除,将在白名单中的企业从训练数据中剔除,读取违约的公司和所有的财报数据,缺失特征数目大于12的数据删除,将在白名单中的企业从训练数据中剔除。
3.根据权利要求1所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:所述设置财报数据中某些样本为违约样本,根据预定义参数不同,违约样本的判定也将不同,将判定为违约的违约样本判定为1,剩余的违约企业财报数据标记为0,财报数据中根据season和delta判预测样本,不参与训练标记为-2,其余的都标记为-1,添加评级日特征。
4.根据权利要求1所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:对应所有年份的中值,各个年份的中值,根据年份和各离散型类别特征做分类的中值,预定义字典。
5.根据权利要求1所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:所述特征工程包括,将缺失值根据median_dict填入,填入的值为对应年份和各离散型类别特征的中值加权平均和对应年份的中值的加权平均,将企业性质,是否上市,二级分类转换成稀疏矩阵,将总资产做分箱,将某些特征等频分箱,若style==season,将流动值转为月平均值,将某些特征做非线性,将某些特征组合,保存处理好的数据。
6.根据权利要求1所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:所述数据预处理部分,可以通过均值或众数等方式来对缺失值进行填充。
7.根据权利要求1所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:切分数据包括,定义好所有类型的数据,1为违约数据,0,-1为置信数据,-2为预测数据,由于正负样本极度不均衡,所以设定一定的比例,尽量使正负样本持平,预训练多个模型,获取其最优参数,再做ensemble模型训练,采用贝叶斯优化寻找最优参数,保证每个模型的数据集是随机的,生成各图的特征重要性和总体的特征重要性,对各模型运用voting的思想得出最后的模型。
8.根据权利要求5所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:所述特征工程部分中可以运用公式运算、成倍数增大或者降低方式对数据进行处理。
9.根据权利要求7所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于:在选择模型部分,除了XGB,LGB和随机森林机器学习模型,也可以选择逻辑回归、SVM、朴素贝叶斯、K近邻、GBDT、决策树分类以及深度学习算法。
10.根据权利要求7所述的一种基于机器学习模型算法的债券违约预警识别技术,其特征在于在模型调参部分,可以运用网格搜索、手动调参等方式进行参数优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海析鲸信息科技有限公司,未经上海析鲸信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110084228.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:支撑治具及清洗设备
- 下一篇:一种电源切换系统及电源切换方法