[发明专利]一种基于图注意力网络的社交网络中文本情感分析方法在审
申请号: | 202010641453.8 | 申请日: | 2020-07-06 |
公开(公告)号: | CN111914185A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 李瑞轩;邵浩程;李玉华;辜希武;杨琪 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/253;G06F40/289;G06N3/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 网络 社交 文本 情感 分析 方法 | ||
1.一种基于图注意力网络的社交网络中文本情感分析方法,其特征在于,包括:
S1.对社交网络中的文本进行词嵌入和依存分析,得到每个文本的词向量和依存矩阵;
S2.利用社交网络中用户的关注关系和文本发布时间,构造文本相关矩阵;
S3.构造基于图注意力网络的社交网络情感分析模型;所述情感分析模型包括文本情感特征提取模块、文本情感融合模块和分类模块;
所述文本情感特征提取模块,利用第一图注意力网络将依存矩阵中的信息融合到词向量中,得到包含语法信息的文本情感特征;
所述文本情感融合模块,利用第二图注意力网络将文本相关矩阵中的信息融合到文本情感特征中,得到融合社交网络关系的新的情感特征向量;
所述分类模块,将新的情感特征向量输入至前馈神经网络,得到情感分类结果;
S4.对所述情感分析模型进行迭代训练,直至模型收敛;
S5.对社交网络中的文本进行步骤S1-S2的处理后,输入至训练好的情感分析模型进行情感分析,得到文本的情感分类结果。
2.根据权利要求1所述的一种基于图注意力网络的社交网络中文本情感分析方法,其特征在于,步骤S1具体包括:
S1.1.利用正则表达式对社交网络中的文本进行清洗,剔除无关内容;
S1.2.对清洗后的文本中包含的中文文本进行分词处理;对包含的英文文本进行词形补全;
S1.3.将所有分词输入已知的词向量库,得到各个分词对应的词向量,将每个文本表示为固定的序列长度和对应词的嵌入;将没有对应词向量的分词表示为固定的缺失向量;
S1.4.对文本中的各个分词进行依存分析得到依存树,将依存树转换成依存矩阵Xd;如果文本中序号为j的词依赖于序号为i的词,则有(Xd)ij=1;否则(Xd)ij=0。
3.根据权利要求1或2所述的一种基于图注意力网络的社交网络中文本情感分析方法,其特征在于,步骤S2具体为,
假设关注者发布了一篇文本B,其对应序号为m,其发布时间为t2,被关注者发布了一篇文本A,对应序号为n,发布时间为t1,若t2-t1t,则认为文本B依赖于文本A,有Xmn=1;t为设定的时间阈值;
遍历整个文档库,得到文本相关矩阵X。
4.根据权利要求1-3任一项所述的一种基于图注意力网络的社交网络中文本情感分析方法,其特征在于,文本情感特征提取模块的具体实施过程具体包括:
将文本的词向量以及文本的依存矩阵输入至第一图注意力网络进行迭代,将依存矩阵中的信息融合到词向量中,得到包含语法信息的新的向量;利用LSTM获取整个句子的上下文向量;最后利用注意力机制捕获不同的词对文本情感特征的贡献,获得最终的文本情感特征。
5.根据权利要求4所述的一种基于图注意力网络的社交网络中文本情感分析方法,其特征在于,文本的词向量以及文本的依存矩阵根据图注意力网络的更新迭代公式进行迭代,以进行特征融合;图注意力网络的更新迭代公式为:
其中,α和W均为参数,为第j个单词的第l次迭代的词向量,n(i)表示与i相邻节点的集合。
6.根据权利要求4所述的一种基于图注意力网络的社交网络中文本情感分析方法,其特征在于,自注意力机制表达式为:
Z=softmax(QKT)V
其中,w1是情感实体词的原始词向量,为一二次迭代后得到的词向量,WQ,Wk,Wv均为参数矩阵,Q、K、V是中间变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010641453.8/1.html,转载请声明来源钻瓜专利网。