[发明专利]一种基于深度学习的评论文本属性级情感分析方法有效
申请号: | 202010284879.2 | 申请日: | 2020-04-13 |
公开(公告)号: | CN111680154B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 黄泽林;赵慧;陈沁蕙 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F18/24;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 陈艳娟 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 评论 文本 属性 情感 分析 方法 | ||
1.一种基于深度学习的评论文本属性级情感分析方法,其特征在于,包括以下步骤:
步骤A:获取公开的评论文本数据,形成原始数据集;
步骤B:为所述原始数据集打上二元组标签;所述二元组标签为(属性类别,情感倾向);
步骤C:文本预处理及分词;
步骤D:利用深度学习框架,采用新型自注意力融合网络,训练得到最终模型,以进行属性级情感分析;步骤D包括:
步骤D1:新型自注意力融合网络首先由两个多头自注意力模块分别对文本及其对应属性标签编码,分别得到文本特征表示及对应属性特征表示;其中,参数化位置向量,将所述位置向量与文本及其属性词向量相加得到输入向量;
步骤D2:将得到的文本特征表示及对应属性特征表示作为输入送入第三个多头注意力模块得到文本-属性融合特征表示;
步骤D3:将文本-属性融合特征表示作为输入送入二维卷积及最大池化模块;
步骤D4:将二维卷积及最大池化模块计算得到的结果送入全连接层并利用softmax函数进行归一化操作得到最终文本针对该属性的情感倾向预测结果概率分布;
步骤D中,多头注意力机制输入包括由n个查询向量组成的矩阵Q∈Rn*d、由n个键向量组成的矩阵K∈Rn*d和由n个值向量组成的矩阵V∈Rn*d;其中d为网络中的隐层向量维度,n为文本句子的长度;三个矩阵按如下公式计算“标度点乘注意力”:
采用H个头部注意力,即线性映射Q、K、V三个矩阵H次;每一个映射后的Q、K、V矩阵都被用于计算“标度点乘注意力”以获得H个头部注意力;最后拼接H个头部注意力,并且将拼接后的向量线性映射为向量o:
o=Concat(head1,…,headH)Wo
其中,参数矩阵及Wo为映射矩阵;
步骤D中,产生文本-属性融合特征表示的第三个多头注意力模块的键向量、值向量输入均为文本特征表示;该模块的查询向量输入为属性特征表示。
2.如权利要求1所述的基于深度学习的评论文本属性级情感分析方法,其特征在于,步骤B包括:
步骤B1:针对目标文本预先定义属性类别,情感倾向定义包括三种:正向情感、负向情感和中立情感;
步骤B2:将所述原始数据集逐一打上二元组标签。
3.如权利要求1所述的基于深度学习的评论文本属性级情感分析方法,其特征在于,步骤C中,文本预处理包括特殊符号去除及停用词去除;分词采用按“字”为单位分隔。
4.如权利要求1所述的基于深度学习的评论文本属性级情感分析方法,其特征在于,步骤D中,所述新型自注意力融合网络将文本及其对应的属性标签的词向量作为输入,得到最终文本针对该属性的情感倾向预测结果概率分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010284879.2/1.html,转载请声明来源钻瓜专利网。