[发明专利]信用违约预测方法、装置及电子设备在审
申请号: | 202011642962.9 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112734570A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 任亮;傅雨梅;罗刚 | 申请(专利权)人: | 北京知因智慧科技有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q30/06;G06Q10/04;G06N3/04;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 董艳芳 |
地址: | 100000 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用 违约 预测 方法 装置 电子设备 | ||
本发明提供了一种信用违约预测方法、装置及电子设备,涉及数据处理技术领域,在对待预测企业进行信用违约预测时,先获取待预测企业的预测数据和舆情信息;其中,该预测数据包括财务数据,该舆情信息包括多个舆情事件;分别对预测数据和舆情信息进行特征提取,得到待预测企业对应的结构化特征和序列特征;根据待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定待预测企业的信用违约预测结果;该预测模型用于对待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。这样能够最大限度的利用结构化特征和序列特征中蕴含的信息,提高了预测结果的准确度。
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种信用违约预测方法、装置及电子设备。
背景技术
信用违约风险是指在商业交易中由于交易一方的违约,使另一方得到的预期现金流量现值减少而遭受的风险。可以基于企业的舆情信息对企业的信用违约风险进行预测。其中,舆情信息是对舆情的一种描述和反映,从理论上讲,所谓舆情信息,就是指在民众社会政治态度的收集、整理、分析、报送、利用和反馈的信息运动过程中,用以客观反映舆情状态及其运动情况的资讯、消息、音信、情报、指令、数据和信号。
然而现有的信用违约预测方法无法有效地利用企业的舆情信息,使得预测结果不够准确。
发明内容
本发明的目的在于提供一种信用违约预测方法、装置及电子设备,以提高预测结果的准确度。
本发明实施例提供了一种信用违约预测方法,包括:
获取待预测企业的预测数据和舆情信息;其中,所述预测数据包括财务数据,所述舆情信息包括多个舆情事件;
分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征;
根据所述待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定所述待预测企业的信用违约预测结果;所述预测模型用于对所述待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。
进一步地,分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征的步骤,包括:
对所述预测数据进行特征筛选、空缺值填充、异常值处理和数据归一化处理,得到所述待预测企业对应的结构化特征;
按照各个所述舆情事件发生的时间,构建目标舆情事件序列;
对所述目标舆情事件序列进行数字编码,得到所述待预测企业对应的序列特征。
进一步地,按照各个所述舆情事件发生的时间,构建目标舆情事件序列的步骤,包括:
按照各个所述舆情事件发生的时间先后顺序,构建初始舆情事件序列;
对所述初始舆情事件序列进行相邻位置重复元素的去除,得到目标舆情事件序列。
进一步地,对所述目标舆情事件序列进行数字编码,得到所述待预测企业对应的序列特征的步骤,包括:
对所述目标舆情事件序列中所有不同的元素依次分别赋予一个从0开始递增的数字,得到所述待预测企业对应的序列特征。
进一步地,所述待预测企业为发债企业;所述方法还包括:
获取训练样本集,所述训练样本集包括历史发债企业在预测窗口内的历史预测数据和历史舆情信息以及预测时间点的实际债券违约结果;
分别对所述历史预测数据和所述历史舆情信息进行特征提取,得到所述历史发债企业对应的结构化特征和序列特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京知因智慧科技有限公司,未经北京知因智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011642962.9/2.html,转载请声明来源钻瓜专利网。