[发明专利]一种基于商品评价的方面级情感分析方法及系统在审
申请号: | 202310618152.7 | 申请日: | 2023-05-29 |
公开(公告)号: | CN116663566A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 崔鹏;潘云辉 | 申请(专利权)人: | 贵州财经大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F40/289;G06F16/35;G06N3/0464;G06N3/0442;G06N3/047;G06Q30/0282 |
代理公司: | 成都坤伦厚朴专利代理事务所(普通合伙) 51247 | 代理人: | 马红彦 |
地址: | 550025*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 商品 评价 方面 情感 分析 方法 系统 | ||
1.一种基于商品评价的方面级情感分析方法,其特征在于,采用以下步骤:
S1:数据预处理和准备:获取商品评价文本数据,利用StanfordcoreNLP解析句子的句法依赖信息,进而获得关于商品评价文本的依赖关系矩阵Arel、依赖类型序列两种句法依赖信息;
S2:特征输入:使用Bert预训练模型或者Glove模型对商品评价文本的上下文语义信息进行词向量映射;随机初始化依赖类型的词向量并进行词嵌入操作,然后使用BiLSTM分别提取语义信息和句法依赖信息,得到语义信息的隐藏向量表示Hc和句法依赖信息的隐藏向量表示Hc1;将Hc与位置距离信息使用交互注意力机制进行融合,然后拼接融合后的Hc和Hc1,得到输入的隐藏向量表示H;
S3:语义特征提取和句法依赖特征提取:使用多头注意力机制分别求出关于语义信息隐藏向量的注意力得分矩阵Asem和关于句法依赖类型信息隐藏向量的注意力得分矩阵Atype,之后把Atype和Arel进行融合得到包含更丰富信息的依赖信息矩阵Asyn,然后Asem与S2阶段得到的H送入语义信息图卷积层进行语义信息的特征提取,Asyn与S2阶段得到的H送入到句法信息图卷积层进行句法信息特征提取;
S4:信息交互:使用交互注意力进行S3阶段中每层上下文语义信息隐藏向量和句法依赖信息之间的信息隐藏向量交互,使得语义信息指导句法依赖信息参数更新学习,句法依赖信息指导语义信息参数更新学习,如此经过三层图卷积操作,其中每层图卷积之后进行交互注意力操作;
S5:情感极性分类:对经过特征提取和交互的最终隐藏输出进行方面词的MASK平均操作,然后softmax对商品评价文本进行最后的情感预测。
2.根据权利要求1所述的基于商品评价的方面级情感分析方法,其特征在于,在步骤S1中,在使用句法依赖类型的词嵌入之前,首先构建关于依赖类型的语料库,即依赖类型的词汇表;在根据依存句法分析和句法解析构建依赖关系矩阵Arel时,使用StanfordNLP句法解析器。
3.根据权利要求1所述的基于商品评价的方面级情感分析方法,其特征在于,在步骤S2中,随机初始化依赖类型词向量中,将随机初始维度设置成40维;用来提取语义信息的BiLSTM的隐藏层维度和提取句法依赖信息的BiLSTM的隐藏层维度设置成50维;使用一层BiLSTM提取隐藏特征,并在上述过程中使用dropout来防止模型过拟合,其中词嵌入的dropout值设置为0.7,BiLSTM模型输入中droput设置为0.1,图卷积的中dopout设置为0.1。
4.根据权利要求1所述的基于商品评价的方面级情感分析方法,其特征在于,在步骤S3使用多头注意力机制构建语义信息的概率注意力矩阵和句法依赖信息的概率注意力矩阵之后都进行标准化处理。
5.根据权利要求1所述的基于商品评价的方面级情感分析方法,其特征在于,在步骤S4中,参与语义信息和句法依赖信息交互的两个向量矩阵在交互完成之后,用dropout防止过拟合,并每次交互之后标准化。
6.根据权利要求1所述的基于商品评价的方面级情感分析方法,其特征在于,在步骤S5中,在训练阶段使用交叉熵计算真实标签和预测标签之间的损失值,在测试阶段根据预测结果表示来做模型方法的效果评估。
7.一种基于商品评价的方面级情感分析系统,其特征在于,包括:语义模块、句法依赖模块、信息融合交互模块和情感极性输出模块四大部分,其中语义模块包括词嵌入层、编码层、语义信息图卷积层;句法依赖模块包括句法解析层、编码层、句法依赖信息图卷积层;
语义模块:词嵌入层,主要是以高维的数字向量代表一句话中的每一个分词标记,使用Bert进行词向量的表示;编码层,使用BiLSTM计算上下文语义信息的隐藏特征;语义信息图卷积层,将融合了线性结构位置距离的上下文语义信息、树形结构句法依赖类型信息的隐藏向量和上下文隐藏向量的概率矩阵进行图卷积操作。
句法依赖模块:句法解析层,使用StanfordNLP解析句子的句法依赖信息,以获得包含依赖关系和依赖类型的句法依赖信息;编码层,随机初始化依赖类型的词向量,并使用BiLSTM计算依赖类型信息的隐藏特征;句法依赖信息图卷积层,将融合了线性结构位置距离的上下文语义信息、树形结构句法依赖类型信息的隐藏向量和句法依赖关系类型的概率矩阵进行图卷积操作;
信息融合交互模块:在图卷积的过程中,使用交互注意力充分交互语义信息和句法依赖信息;
情感极性输出模块:对经过特征提取和交互的最终隐藏输出进行方面词的MASK平均操作,然后softmax进行最后的情感预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州财经大学,未经贵州财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310618152.7/1.html,转载请声明来源钻瓜专利网。