[发明专利]基于Electra深度神经网络的金融新闻舆情预警分类方法及系统在审
申请号: | 202211619985.7 | 申请日: | 2022-12-15 |
公开(公告)号: | CN116151989A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 史珂;张笑冬;何平 | 申请(专利权)人: | 兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06F16/9535;G06F16/906;G06F18/241;G06F40/211;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 单雯 |
地址: | 350014 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 electra 深度 神经网络 金融 新闻 舆情 预警 分类 方法 系统 | ||
1.一种基于Electra深度神经网络的金融新闻舆情预警分类方法,其特征在于,包括:
步骤S1:采集金融新闻数据并进行标注;
步骤S2:对标注后的金融新闻数据进行预处理,并输入至Electra预训练模型进行增量训练和更新模型权重,得到更新后的Electra深度神经网络模型;
步骤S3:通过所述Electra深度神经网络模型得到文本表征,进而判断对应的金融新闻数据文本是否为负面文本,若是,则触发步骤S4;若否,则不进行预警;
步骤S4:提取负面的金融新闻数据文本中的主旨句,在通过Electra深度神经网络模型提取每个主旨句中的舆情种类特征;
步骤S5:将所述舆情种类特征输入至分类器中进行分类,得到最终金融新闻的舆情分类,进而实现预警指令。
2.根据权利要求1所述的基于Electra深度神经网络的金融新闻舆情预警分类方法,其特征在于,所述标注包括将采集的金融新闻数据根据预设的类别标签进行标注;
所述类别标签包括金融业务异常行为、经营不善、企业运作异常、企业重大变革行为、借户方面除业务外重大负面信息和借户违法行为。
3.根据权利要求1所述的基于Electra深度神经网络的金融新闻舆情预警分类方法,其特征在于,所述预处理包括对金融新闻数据进行数据清洗,去除无效字符,同时限制文本最大长度输入为512个字节,超出所述最大长度的部分采用切片输入的方式,依次输入后端的分词器来获得文本分词。
4.根据权利要求1所述的基于Electra深度神经网络的金融新闻舆情预警分类方法,其特征在于,所述步骤S3包括:将所述待分类金融新闻数据对应的文本编码输入所述Electra深度神经网络模型的全连接层,并通过判别器对所述编码的张量做二分类,输出当前金融新闻数据是否为负面分类。
5.根据权利要求1所述的基于Electra深度神经网络的金融新闻舆情预警分类方法,其特征在于,步骤S4包括:
步骤S4.1:取出判别出的负面金融新闻数据文本中的每一个句子作为输入文本,通过命名实体识别得到对应的句子主体;
步骤S4.2:计算所述主体和主体对应的文本标题的相似度,计算公式如下:
其中,B表示文本标题中词组的词向量均值,Ji表示当前文本中第i个句子的主体词的词向量均值,Si表示当前文本中第i个句子的主体和主体对应的文本标题的相似度;
步骤S4.3:选择相似度得分最高的对应句子作为主旨句。
6.一种基于Electra深度神经网络的金融新闻舆情预警分类系统,其特征在于,包括:
模块M1:采集金融新闻数据并进行标注;
模块M2:对标注后的金融新闻数据进行预处理,并输入至Electra预训练模型进行增量训练和更新模型权重,得到更新后的Electra深度神经网络模型;
模块M3:通过所述Electra深度神经网络模型得到文本表征,进而判断对应的金融新闻数据文本是否为负面文本,若是,则触发模块M4;若否,则不进行预警;
模块M4:提取负面的金融新闻数据文本中的主旨句,在通过Electra深度神经网络模型提取每个主旨句中的舆情种类特征;
模块M5:将所述舆情种类特征输入至分类器中进行分类,得到最终金融新闻的舆情分类,进而实现预警指令。
7.根据权利要求6所述的基于Electra深度神经网络的金融新闻舆情预警分类系统,其特征在于,所述标注包括将采集的金融新闻数据根据预设的类别标签进行标注;
所述类别标签包括金融业务异常行为、经营不善、企业运作异常、企业重大变革行为、借户方面除业务外重大负面信息和借户违法行为。
8.根据权利要求6所述的基于Electra深度神经网络的金融新闻舆情预警分类系统,其特征在于,所述预处理包括对金融新闻数据进行数据清洗,去除无效字符,同时限制文本最大长度输入为512个字节,超出所述最大长度的部分采用切片输入的方式,依次输入后端的分词器来获得文本分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司,未经兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211619985.7/1.html,转载请声明来源钻瓜专利网。