[发明专利]一种结合重构句法信息的端到端方面级情感分析方法有效
申请号: | 202110163081.7 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112926337B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 相艳;张济群;张名芳;线岩团 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F40/284;G06F40/126;G06F16/35 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 句法 信息 端方 情感 分析 方法 | ||
本发明涉及一种结合重构句法信息的端到端方面级情感分析方法,属于自然语言处理技术领域。本发明包括步骤:通过Bert预训练模型对文本编码,获得具有上下文表征的词向量表征;使用双仿射模型Biaffine获得最初的句法树;将最初的句法树通过句法规则重塑修剪获得新的依赖树;使用注意力神经网络对新的依赖树编码得到重构的句法特征;使用分别得到的词向量表征和重构的句法特征进行特征拼接融合后输入至下游序列标注模型;通过下游序列标注模型的输出结果得到方面级情感分析的结果。本发明能够获得方面词和观点词之间的有效的句法依赖关系,提升方面级情感分析任务的性能。
技术领域
本发明涉及一种结合重构句法信息的端到端方面级情感分析方法,属于自然语言处理技术领域。
背景技术
传统上,基于方面的情感分析(ABSA)任务可以分为两个子任务,即方面词提取任务和方面级情感分析任务。方面词提取的目的是检测评论文本中提到的观点目标,并且对其进行广泛的研究。方面级情感分类的目的是通过方面词寻找到对应的意见表达词,可以帮助模型预测给定方面目标的情感极性。目前关于ABSA的工作大多旨在解决其中的某一个子任务。为了将这些现有方法应用于实际环境中,即,不仅提取评价对象,而且预测其情感极性,一种典型的方法是将两个子任务以流水线的方法连接在一起。但是通过对其他一些任务的观察可以发现,如果两个子任务具有很强的关联性,例如命名实体识别(NER)和关系提取任务,集成度更高的模型通常比流水线的解决方案更有效。
在最新的研究中,Li等人研究了BERT的建模能力,将深层上下文词嵌入层与下游神经模型耦合以完成原始ABSA任务,并建立了新的最新技术成果。但以上模型仅考虑了方面词本身,没有考虑到评论句子中观点词对方面词情感极性的影响,判断情感极性是基于当前的方面词信息,这样做会丢失对判断情感有用的远距离的依赖。针对以上问题,提出了一种面向短语表达的句法依赖树结构,增强方面词和观点词之间的关联感知能力,获取方面词和观点词之间的有效的句法依赖关系。
发明内容
为了解决上述问题,本发明提供了一种结合重构句法信息的端到端方面级情感分析方法,本发明能增强方面词和观点词之间的关联感知能力,获取方面词和观点词之间的有效的句法依赖关系。
本发明的技术方案是:一种结合重构句法信息的端到端方面级情感分析方法,所述方法的具体步骤如下:
步骤1、通过Bert预训练模型对文本编码,获得具有上下文表征的词向量表征;
步骤2、使用双仿射模型Biaffine获得最初的句法树;
步骤3、将最初的句法树通过句法规则重塑修剪获得新的依赖树;
步骤4、使用注意力神经网络对新的依赖树编码得到重构的句法特征;
步骤5、使用步骤1与步骤4分别得到的词向量表征和重构的句法特征,进行特征拼接融合后输入至下游序列标注模型;
步骤6、通过下游序列标注模型的输出结果得到方面级情感分析的结果。
作为本发明的进一步方案,所述步骤1中,Bert嵌入层将句子作为输入,利用整个句子的信息来计算词级特征,词向量表征通过公式Hl=Transformerl(Hl-1)计算,其中Hl表第l层的特征表示。
作为本发明的进一步方案,所述步骤3中,将最初的句法树通过句法规则重塑修剪获得新的依赖树的具体步骤如下:
步骤3.1、对最初的句法树进行深度优先遍历,得出从root→children的各个带有单词、依赖信息和词性信息的枝节;
步骤3.2、按句法规则顺序依次进行查询,并设置大小为2步进为1的滑动窗口进行切分;并对窗口内的数据进行处理,若符合句法规则,则将窗口内两个单词间的依赖关系改为第一个单词与其父节点的依赖关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163081.7/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置