[发明专利]一种基于深度学习算法的金融同业舆情分析方法及系统在审
申请号: | 202010424186.9 | 申请日: | 2020-05-19 |
公开(公告)号: | CN111639183A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 李振;鲍东岳;张刚;尹正;刘昊霖;张雨枫;徐超;陈厚霖;马圣楠;傅佳美 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 算法 金融 同业 舆情 分析 方法 系统 | ||
本发明涉及舆情分析技术领域,提供了一种基于深度学习算法的金融同业舆情分析方法及系统,所述方法对经过预处理的同业新闻文本数据依次进行性质分析、事件分类及事件主体发现,得到特定事件及特定领域范围内的舆情状况;其中,性质分析的结果包括三个类别:正向、中性、负向;事件分类用以得到新闻类型判断结果;事件主体发现用以发现同业新闻文本的主体,并将主体与事件进行对应。所述系统包括同业新闻文本数据预处理模块、性质分析模块、事件分类模块及事件主体发现模块。本发明在三个模型的基础上结合中文以及新闻文本的特殊性做了模型的训练及改进,能最大限度优化模型判断结果提升计算效率,实现定时处理舆情判断。
技术领域
本发明涉及舆情分析技术领域,特别涉及一种基于深度学习算法的金融同业舆情分析方法及系统。
背景技术
随着我国互联网的迅速发展,网民数量及互联网信息呈现爆发性增长,在如此大量的信息中,如何进行甄别,挑选出实际性的信息以及关联人,是非常重要的。从舆情监控的角度来说,我们每天的信息中,涵盖着各类舆情信息,而各种舆情信息汇总后,如何在更短的事件、更有效的进行识别、更好的得出所需的结果,是舆情分析的关键。
从传统的舆情监控系统来看,主要以关键词为主,可根据地域、来源、分类等筛选,按期提供舆情监测报告。但无法对大量新闻内各主体及对应关系进行自动识别,仍然需要人工进行判断。
现有的舆情系统大多是建立在微博、论坛、博客等评论文本基础上,通过热词抽取和文本聚类抓取当前的舆情热点,但是现有的文章来源与处理方法应用到金融行业存在着较大弊端。首先,评论文本存在着大量注水数据以及不真实评论,相对于正式的同业新闻文本而言评论文本的影响力以及可信度都较小,参考度较低;其次进行热词抽取以及文章聚类会导致文章类型以及描述主题的确认偏差或者无法明确真实的描述主体事件,导致舆情的判断出现错误。
发明内容
本发明的目的是克服现有技术的不足,提供了一种基于深度学习算法的金融同业舆情分析方法及系统,相较于传统方法做了较大的改变,本发明旨在对同业新闻语料进行舆情分析,对于近期热点事件以及相应的企业、个人以及其它组织,结合网络上群众的价值取向以及社会态度进行科学直观的归纳总结;通过对每篇文章的情感取向和事件种类的判定,结合描述主体的输出,给出对应时间段内的金融相关舆情总结,使得相关人员在不需要阅读海量文本的前提下,快速了解大量信息,并通过对新闻中出现的事件类别以及特定主体的情感倾向性总结对热点事件有一个直观的认识。
本发明采用如下技术方案:
一种基于深度学习算法的金融同业舆情分析方法,所述方法对经过预处理的同业新闻文本数据依次进行性质分析(情感分析)、事件分类及事件主体发现,得到特定事件及特定领域范围内的舆情状况;其中,所述性质分析的结果包括三个类别:正向、中性、负向;所述事件分类用以得到新闻类型判断结果;所述事件主体发现用以发现同业新闻文本的主体,并将主体与事件进行对应。
进一步的,所述方法具体包括:
S1、对同业新闻文本数据进行预处理;
S2、经过步骤S1预处理的同业新闻文本数据输入XLNET性质分析模型,得到性质分析的判断结果;
S3、经过步骤S1预处理的同业新闻文本数据输入BERT分类模型,得到新闻类型判断结果;
S4、将经过步骤S1预处理的同业新闻文本数据及经过步骤S3处理得到的新闻类型判断结果输入注意力机制的事件主体发现模型,得到“主体-事件”的对应表示;
S5、将步骤S4得到的“主体-事件”的对应表示按照情感方向进行归纳,根据出现频率以及相似度计算,罗列出近期的热点主体、热点事件以及相互对应关系,得到特定事件以及领域范围内的舆情状况。
进一步的,步骤S1中,对同业新闻文本数据进行预处理具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010424186.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器状态独立监控系统及方法
- 下一篇:一种面向申威平台的容器热迁移方法