[发明专利]一种新闻长文本情感分析方法及装置在审
申请号: | 202110346247.9 | 申请日: | 2021-03-31 |
公开(公告)号: | CN112860843A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 孔繁爽;李策;江林格 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06F16/36 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 文本 情感 分析 方法 装置 | ||
本发明提供了一种新闻长文本情感分析方法及装置,可以应用于人工智能领域,方法包括:针对长文本中的单句生成语句的依存树;对长文本中的单句进行词向量初始化;基于依存树结构信息更新词向量,对单句中的不同情感对象进行情感分析获得不同情感对象的情感分析列表;根据情感分析列表获取长文本中全部情感对象的情感得分,获得情感分析结果。本申请通过GCN编码依存树改进词向量表示来进行单句的情感分析,对于长文本中同一情感对象在不同句子中的不同情感,采用所在句子重要性打分结果作为该情感对象的情感指数权重,加权求和得到长文本针对具体情感对象的情感指数,解决了新闻中涉及情感实体较多、文本较长的问题。
技术领域
本申请属于自然语言处理技术领域,具体地讲,涉及一种新闻长文本情感分析方法及装置。
背景技术
随着大量文本的积累与自然语言处理相关模型使用效果的提升,情感分析技术为舆情分析、民意调查等工作起到越来越重要的支撑作用。银行业中对于法人客户新闻的情感指数分析对于银行风控有很重要的作用,但是目前对于法人客户新闻的情感分析存在两方面的问题:一方面,在一篇新闻中往往涉及多个情感对象,对于每个情感对象,新闻表达出不同的情感倾向,例如,关于一个法人客户A的新闻中,可能会引入其他客户:B、C、D,而新闻内容中对于不同情感对象即A、B、C、D有不同的情绪指数;另一方面,金融新闻文章篇幅往往较长,而目前大多数情感对象的情感分析多是针对单个句子,对于整篇文档进行细粒度情感分析的方法非常少。
发明内容
本申请提供了一种新闻长文本情感分析方法及装置,以至少解决当新闻中涉及多个情感对象时,无法对新闻整体的情感表达进行有效把控分析的问题。
根据本申请的一个方面,提供了一种新闻长文本情感分析方法,包括:
针对长文本中的语句生成语句的依存树;
获取所述长文本中的单句的初始词向量;
对根据所述依存树和所述初始词向量生成的词向量进行情感分类获得不同情感对象的情感分析列表;
根据情感分析列表获取长文本中全部情感对象的情感得分,获得情感分析结果。
在一实施例中,获取所述长文本中的单句的初始词向量,包括:
使用Bert获得单句中融合上下文特征信息的初始词向量。
在一实施例中,对根据所述依存树和所述初始词向量生成的词向量进行情感分类获得不同情感对象的情感分析列表,包括:
基于依存树结构使用GCN算法对所述初始词向量进行迭代训练获得词向量;
提取语句中的全部情感对象;
将情感对象的词向量输入情感分类器中获得情感分类结果;
根据情感分类结果和情感对象的对应关系建立情感分析列表。
在一实施例中,根据情感分析列表获取长文本中全部情感对象的情感得分,获得情感分析结果,包括:
将长文本分割为若干个句子;
使用语义编码模型将分割后的句子用向量表示,获得句子向量;
计算所有句子向量之间的相似度;
根据句子和句子向量之间的相似度构建权重连接图;
根据所述权重连接图获取每个句子的重要性;
以每个句子的重要性作为权重对所述情感分析列表加权求和获得情感得分。
根据本申请的另一个方面,还提供了一种新闻长文本情感分析装置,包括:
依存树生成单元,用于针对长文本中的语句生成语句的依存树;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110346247.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融合情感词典的情感分析方法及装置
- 下一篇:冷却水循环组件及电炉系统