[发明专利]一种基于句法关系和意见词分布的细粒度情感分析方法在审
申请号: | 202110734499.9 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113535897A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 汤景凡;崔硕;姜明;张旻 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 句法 关系 意见 分布 细粒度 情感 分析 方法 | ||
本发明公开了一种基于句法关系和意见词分布的细粒度情感分析方法。首先根据Bert模型构建了自己的词嵌入向量,目的是利用只利用Bert的语言模型功能。其次为了更好的提取句中的意见词分布,引入了依存句法分析,基于依存句法分析结果以及目标方面词,并结合邻近原则等原理提取出意见词分布。这样就能够将句中与方面词有直接或间接依赖关系的词提取出来,同时为了能够利用这一信息,本发明还将这一结果进行了向量化处理,称为分布向量。最后将这一向量与Bert输出的上下文向量进行特征融合,得到全新的情感特征向量,并进行情感预测。实验结果表明,本发明能很好解决方面词与意见词的匹配问题,并且能够深层次的提取到情感特征,具有很好的适应能力。
技术领域
本发明涉及方面情感分析技术领域,具体来讲是一种基于句法关系和意见词分布的细粒度情感分析方法。
背景技术
细粒度情感分析,也称基于方面的情感分析,它不是考虑整个句子情感极性,而是从细粒度的角度去研究,目的是针对于句子出现的某些方面(aspect),并对这些方面的情感倾向进行判断。
现阶段主流的情感分析方法有CNN、RNN和自注意力机制等。CNN采用定长的卷积核对句子向量进行卷积操作,再通过池化进行特征提取,但对于句中有多个方面词时,往往难以准确分辨对应的意见词,例如前文评论中“面料很好有型挺好看,而且手感不错,无异味,而且价格想比较而言比较实惠。”这一部分运用CNN进行特征提取时,CNN可能难以将“无异味”这一词与“价格”影响完全排除。虽然RNN模型在处理短文本时表现良好,但同样随着网络评论的句式复杂化、内容多样化以及句子越来越长后,其表现性能也逐渐平常。因为RNN的每一步处理都会依赖前一步的结果,但句式复杂且句子过长后,后文与前文中重要的信息会在逐步迭代的过程中丢失掉。而且,一个方面词的情感倾向往往由几个关键的意见词决定,倘若丢失了关键的意见词,对于情感分析的结果会产生难以估量的影响。
因此,后人才提出注意力机制进行情感分析,通过对齐模型分析出句子中每个词之间的影响程度,构建权重向量,给关键词赋予较大的权重、无关词分配较小的权重。这样做在一定程度上提高了情感分析的任务准确率,但当句中有多个方面词时,意见词也会相对的增加,权重的分配就会面临一个问题,注意力机制的对齐模型难以区分哪个意见词对当前方面词是较为重要的,进而导致权重分配时,多个意见词的权重会不分上下。总之,单纯的注意力机制也难以应对如今复杂结构的网络评论句。近年来图神经网络也在尝试解决这一问题,图神经网络运用句中词与词之间的依赖关系构建关系图,并在特征提取阶段运用卷积或者注意力的方式将依赖信息加以运用,使得每个词都会获取与它有依赖关系的特征。这样做解决了方面词与意见词的匹配问题,使得每个方面词都能直接获取与它有依赖关系的词语信息。但这样的处理同样存在一定的问题,因为目前大多数图神经网络只是基于词与词之间一层关系去运算的,当修饰方面词的意见词是多个词组成的词组时,单独观察修饰方面词的意见词就难以判断出情感倾向,这时就需要考虑修饰意见词的词语或其他相关词语,即反应情感特征的词之间具有一种深层次的结构关系。
发明内容
在综合考量上述问题后,本发明针对现有技术存在的问题,提出一种基于句法关系和意见词分布的细粒度情感分析方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤(1)根据输入的句子W构建初始化词嵌入向量Token Embedding和位置编码向量PositionEmbedding,并将其作为bert预训练模型的输入,训练后得到句子向量;
步骤(2)对句子W进行依存句法分析,获取到句中词与词的依赖关系;
步骤(3)根据已知的方面词和步骤(2)获取的依赖关系,对句子中与方面词有直接依赖关系的关键词进行提取,提取到的关键词存储到集合Key中;
步骤(4)根据集合Key中的关键词,构建意见词分布向量;
步骤(5)运用意见词分布向量对步骤(1)获得的句子向量进行特征变换,计算后得到情感特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110734499.9/2.html,转载请声明来源钻瓜专利网。