[发明专利]一种基于图神经网络的情感分类方法在审
申请号: | 202211070367.1 | 申请日: | 2022-09-02 |
公开(公告)号: | CN115510226A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 廖清;汤思雨;柴合言;王晔;高翠芸;方滨兴 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/211;G06F40/242;G06F40/30;G06N3/04;G06N3/08;G06F17/16;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 江嘉玲 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 情感 分类 方法 | ||
1.一种基于图神经网络的情感分类方法,其特征在于,所述方法包括:
将获取的文本句输入BERT编码器中,得到所述文本句的上下文表示;
基于文本句的句法依赖树,构建所述文本句的初始邻接矩阵;
使用Glove词向量模型将所述初始邻接矩阵映射成非负的初始化邻接矩阵表示;
构建根选择分数向量,将所述根选择分数向量和所述初始化邻接矩阵表示输入到结构归纳器中,基于拉普拉斯变体矩阵来计算边际概率,基于所述边际概率得到所述文本句的归纳后的潜在图Glat以及基于多头注意力机制得到所述文本句的语义图Gsem;
将所述潜在图Glat和所述语义图Gsem输入到图神经网络中分别得到潜在图表示和语义图表示结合所述潜在图表示和所述语义图表示得到经过语义信息增强的潜在图表示Hg-lat和与潜在图交互后的语义图表示Hg-sem;
基于所述语义信息增强的潜在图表示Hg-lat和所述与潜在图交互后的语义图表示Hg-sem,通过设计掩码矩阵得到用于情感分析的特征表示,将所述特征表示进行平均池化操作得到最终特征表示,将所述最终特征表示输入到图神经网络的线性层,得到所述文本句的方面词的情感极性。
2.根据权利要求1所述的基于图神经网络的情感分类方法,其特征在于,所述将获取的文本句输入BERT编码器中的步骤还包括:
将所述文本句与所述文本句的方面词结合,并在其中加入第一预设符号和第二预设符号,得到所述文本句的方面对。
3.根据权利要求1所述的基于图神经网络的情感分类方法,其特征在于,所述基于文本句的句法依赖树,构建所述文本句的初始邻接矩阵的步骤包括:
将单词作为节点和句法依赖树中单词之间的依赖关系类型作为边,构建所述文本句的初始邻接矩阵Aij:
其中,rij表示文本句中第i个单词wi和第j个单词wj之间的依赖关系类型,i,j=1...n,W1a表示线性映射层的权重,表示softmax层的权重,表示线性映射层的偏置,表示softmax层的偏置。
4.根据权利要求1所述的基于图神经网络的情感分类方法,其特征在于,所述构建根选择分数向量表示为:
ri=exp(Wrhi+br),i=1...n,
其中,Wr表示计算潜在结构根的神经网络层的权重,br表示计算潜在结构根的神经网络的偏置,hi表示输入文本句中第i个词的上下文特征。
5.根据权利要求1所述的基于图神经网络的情感分类方法,其特征在于,所述拉普拉斯变体矩阵表示为:
边际概率表示为:
其中,ri表示文本句中的第i个单词被选择为潜在结构根的概率分数,Pij表示第i个单词与第j个单词之间的潜在依赖连接的边际概率,表示拉普拉斯变体矩阵的对角线,表示拉普拉斯变体矩阵的第j行第i列。
6.根据权利要求1所述的基于图神经网络的情感分类方法,其特征在于,在所述构建根选择分数向量,将所述根选择分数向量和所述初始化邻接矩阵表示输入到结构归纳器中,基于拉普拉斯变体矩阵来计算边际概率的步骤中引入根细化策略,具体公式为:
其中,为第i个单词为结构根的概率,pi∈{0,1}表示第i个单词是否是方面词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211070367.1/1.html,转载请声明来源钻瓜专利网。