[发明专利]基于Electra深度神经网络的金融新闻舆情预警分类方法及系统在审
申请号: | 202211619985.7 | 申请日: | 2022-12-15 |
公开(公告)号: | CN116151989A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 史珂;张笑冬;何平 | 申请(专利权)人: | 兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06F16/9535;G06F16/906;G06F18/241;G06F40/211;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 单雯 |
地址: | 350014 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 electra 深度 神经网络 金融 新闻 舆情 预警 分类 方法 系统 | ||
本发明提供了一种基于Electra深度神经网络的金融新闻舆情预警分类方法及系统,包括:采集金融新闻数据并进行标注然后对其进行预处理,并输入至Electra预训练模型进行增量训练和更新模型权重,得到更新后的Electra深度神经网络模型;通过该模型得到文本表征,进而判断对应的金融新闻数据文本是否为负面,若是,则提取负面的金融新闻数据文本中的主旨句,再通过Electra深度神经网络模型提取每个主旨句中的舆情种类特征;若否,则不进行预警;将舆情种类特征输入至分类器中进行分类,得到最终金融新闻的舆情分类进而实现预警指令。本发明实现了特定领域非结构化的文本数据特征提取和分类,从而解决了金融新闻舆情预警分类的问题。
技术领域
本发明涉及数据处理技术领域,具体地,涉及一种基于Electra深度神经网络的金融新闻舆情预警分类方法及系统。
背景技术
网络舆情技术从诞生起就显示出巨大的威力,涉足面也愈来愈广,已经从单纯的社会领域走入了专业性更强的金融投资领域。由于信息通讯技术和互联网的发展,互联网金融信息对金融市场的影响已经越来越不容忽视。这些信息关乎着整个金融行业的发展和稳定。
金融舆情指各类金融相关信息发布主体基于各自观点,就某种主题,通过各种信息传播渠道进行信息发布,引起不同主体问信息互动的状态。金融业相关舆情的产生、发展演化会对金融业乃至宏观经济运行产生重要影响,这是金融舆情应当受到特别关注的原因。但是目前互联网上的金融文本层次多样,冗余信息多,不利于金融新闻舆情分类检测。
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。在深度学习出现之前,传统的自然语言处理方法,例如基于规则的方法、概率建模和线性分类器,已被广泛用于诸如垃圾邮件过滤、情感分类等任务中。这些经典方法利用了序列的统计学特征以及简单的语言特征。但是,这些技术的主要缺点在于无法捕获复杂的语言特征。随着深度学习模型BERT的问世,基于它的自然语言处理技术,能够很好的获取文本的语言特征,从而成为各种文本处理任务中最好的方法。
专利文献CN114398480A公开了一种基于关键信息抽取的金融舆情细分方面检测方法和设备,步骤包括对金融文本数据和金融舆情标签描述集合进行预处理;对金融文本片段句和金融舆情标签句进行编码,得到片段句表征;对金融文本片段句和金融舆情标签描述集合进行相似度表征,再进行分类训练,得到关键信息句抽取分类辅助模型;利用关键信息句抽取分类辅助模型计算金融文本片段句对金融舆情标签描述集合的重要程度,并选取标签关键句;构建标签关键句组合输入金融文本,进行细分舆情分类。
但是专利文献CN114398480A使用循环神经网络进行编码,不能充分获取文本上下文蕴含的语意信息,从而导致后续任务的准确率达不到很高水平。并且该文献基于关键信息抽取做出金融舆情细分,不涉及判断金融新闻是否包含金融舆情的判断,进而无法直接对互联网中的海量信息进行判断。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于Electra的金融新闻舆情预警分类方法及系统。
根据本发明提供的一种基于Electra深度神经网络的金融新闻舆情预警分类方法,包括:
步骤S1:采集金融新闻数据并进行标注;
步骤S2:对标注后的金融新闻数据进行预处理,并输入至Electra预训练模型进行增量训练和更新模型权重,得到更新后的Electra深度神经网络模型;
步骤S3:通过所述Electra深度神经网络模型得到文本表征,进而判断对应的金融新闻数据文本是否为负面文本,若是,则触发步骤S4;若否,则不进行预警;
步骤S4:提取负面的金融新闻数据文本中的主旨句,在通过Electra深度神经网络模型提取每个主旨句中的舆情种类特征;
步骤S5:将所述舆情种类特征输入至分类器中进行分类,得到最终金融新闻的舆情分类,进而实现预警指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司,未经兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211619985.7/2.html,转载请声明来源钻瓜专利网。