[发明专利]一种基于深度学习算法的金融同业舆情分析方法及系统在审
申请号: | 202010424186.9 | 申请日: | 2020-05-19 |
公开(公告)号: | CN111639183A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 李振;鲍东岳;张刚;尹正;刘昊霖;张雨枫;徐超;陈厚霖;马圣楠;傅佳美 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 算法 金融 同业 舆情 分析 方法 系统 | ||
1.一种基于深度学习算法的金融同业舆情分析方法,其特征在于,所述方法对经过预处理的同业新闻文本数据依次进行性质分析、事件分类及事件主体发现,得到特定事件及特定领域范围内的舆情状况;其中,所述性质分析的结果包括三个类别:正向、中性、负向;所述事件分类用以得到新闻类型判断结果;所述事件主体发现用以发现同业新闻文本的主体,并将主体与事件进行对应。
2.如权利要求1所述的基于深度学习算法的金融同业舆情分析方法,其特征在于,所述方法具体包括:
S1、对同业新闻文本数据进行预处理;
S2、经过步骤S1预处理的同业新闻文本数据输入XLNET性质分析模型,得到性质分析的判断结果;
S3、经过步骤S1预处理的同业新闻文本数据输入BERT分类模型,得到新闻类型判断结果;
S4、将经过步骤S1预处理的同业新闻文本数据及经过步骤S3处理得到的新闻类型判断结果输入注意力机制的事件主体发现模型,得到“主体-事件”的对应表示;
S5、将步骤S4得到的“主体-事件”的对应表示按照情感方向进行归纳,根据出现频率以及相似度计算,罗列出近期的热点主体、热点事件以及相互对应关系,得到特定事件以及领域范围内的舆情状况。
3.如权利要求2所述的基于深度学习算法的金融同业舆情分析方法,其特征在于,步骤S1中,对同业新闻文本数据进行预处理的具体方法为:
S1.1利用网页爬虫系统爬取规定时间段以及地域范围内的同业新闻文本数据,抓取得到的网页爬虫数据仅保留网页文章正文和标题部分以及论坛文字的评论部分;
S1.2将经步骤S1.1处理后得到的同业文本数据中的无效信息删除,所述无效信息包括特殊字符、网页引导和超链接;
S1.3经步骤S1.2处理后的清洁同业新闻文本数据转换为字符与编码,对应的字符编码作为后续模型输入。
4.如权利要求3所述的基于深度学习算法的金融同业舆情分析方法,其特征在于,步骤S2中,使用性质分析模型进行性质分析的方法为:
S2.1经过步骤S1处理后的同业文本数据划分为训练数据和实际数据;
S2.2将训练数据及对应情感标签导入到XLNET的文本分类预训练模型中,进行模型训练,储存模型为二进制编码的.m格式;
S2.3将编码格式的实际数据传入到训练后的XLNET性质分析模型中,得到文章的情感判断结果。
5.如权利要求4所述的基于深度学习算法的金融同业舆情分析方法,其特征在于,步骤S3中,新闻类型判断的方法为:
S3.1将训练集数据以及对应类别标签导入到BERT的文本分类预训练模型中,进行模型训练,储存模型为二进制编码的.m格式;
S3.2将编码格式的实际数据传入到训练后的BERT文本分类模型中,得到文章的新闻类型结果。
6.如权利要求4所述的基于深度学习算法的金融同业舆情分析方法,其特征在于,步骤S4中,事件主体发现的具体方法为:
S4.1将训练集数据以及对应主体标签的对应表示导入到事件主体发现模型中,进行模型训练,储存模型为二进制编码的.m格式;所述事件主体发现模型为基于注意力机制的序列标注模型;
S4.2将编码格式的实际数据传入到训练后的事件主体发现模型中,得到文章的“主体—事件”的抽取结果。
7.如权利要求5所述的基于深度学习算法的金融同业舆情分析方法,其特征在于,步骤S5的具体方法为:
S5.1计算主体之间的Jaccard系数,如果数值小于0.9则认为是同一主体;同一主体的相同事件次数进行累加,不同事件按照事件出现频率进行排序;
S5.2对同一主体的事件情感倾向进行统计,得到该主体的情感分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010424186.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器状态独立监控系统及方法
- 下一篇:一种面向申威平台的容器热迁移方法