[发明专利]基于多层次的特征注意力的方面级情感分类方法有效
申请号: | 202011540950.5 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112579778B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 唐宏;周磊;向俊玲;刘双 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多层次 特征 注意力 方面 情感 分类 方法 | ||
1.一种基于多层次的特征注意力的方面级情感分类方法,其特征在于,包括:
S1:获取文本数据的文本信息和方面词信息,对文本信息和方面词信息分别进行词嵌入编码,得到文本词向量和方面词向量;
S2:将待预测情感极性的方面词进行相对位置编码,将位置编码与文本词向量进行融合,得到融合位置信息的文本词向量;
S3:采用双向门控循环单元网络LSTM分别对融合位置信息的文本词向量和方面词向量进行预处理,得到融合位置信息的文本词序列和方面词序列;
S4:将融合位置信息的文本词序列和方面词序列进行交互处理,得到文本词序列和方面词序列的交互信息;
S5:提取交互信息的句子级别的注意力信息;
S51:将交互信息I通过列softmax得到方面词-句子的注意力信息αij;将交互信息I通过行softmax得到句子-方面词级别的注意力信息βij;
S52:将句子-方面词级别的注意力信息βij按列求平均,得到方面词级别的注意力信息
S53:根据方面词级别的注意力信息和方面词-句子的注意力信息αij计算句子级别注意力信息;
S6:对方面词序列进行平均池化处理,采用注意力机制将池化后的方面词序列和融合位置信息的文本词序列进行处理,得到全局注意力的文本特征信息;
S61:将方面词序列信息Ht通过平均池化操作得到池化后的方面词信息Htavg;
S62:根据池化后的方面词信息Htavg计算方面词信息在上下文中的重要程度;
S63:根据方面词信息在上下文中的重要程度,采用注意力机制对池化后的方面词信息Htavg和融入位置信息的文本词序列Hx进行处理,得到上下文对方面词的全局注意力信息δi;
S64:根据上下文对方面词的全局注意力信息δi计算单词的注意力权值,得到全局注意力的文本特征信息Hr;
S7:采用卷积神经网络CNN提取全局注意力的文本特征信息的局部特征,得到文本局部的特征注意力信息;
S8:将句子级别的注意力信息、全局注意力的文本特征信息和文本局部的特征注意力信息进行融合,得到融合信息;
S9:采用全连接层和softmax归一化指数函数对融合信息进行编码处理,得到最终的分类结果。
2.根据权利要求1所述的一种基于多层次的特征注意力的方面级情感分类方法,其特征在于,得到文本词向量和方面词向量的具体过程包括:
步骤1:获取输入文本数据的集合信息s={s1,s2,s3,…,sn},提取输入文本数据的集合信息中待预测极性的方面词,对方面词进行集合,得到待预测极性的方面词集合信息t={t1,t2,t3,…,tm};
步骤2:采用预训练的word2vec模型对待预测极性的方面词集合信息进行处理,生成文本词向量编码和方面词向量编码
其中,sn表示输入文本数据集合中的文本信息,n表示文本包含的单词数,tm表示待预测极性的方面词集合的文本信息,m表示方面词包含的单词数,dw表示词向量的维度。
3.根据权利要求1所述的一种基于多层次的特征注意力的方面级情感分类方法,其特征在于,得到融合位置信息的文本词向量的过程包括:采用相对位置编码函数对文本词向量编码和方面词向量编码进行相对位置编码,得到位置嵌入矩阵;在模型的训练过程中对位置嵌入矩阵进行初始化和更新,得到文本位置向量;将文本向量与文本位置向量连接,得到融入位置信息的文本向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011540950.5/1.html,转载请声明来源钻瓜专利网。