[发明专利]基于双通道卷积记忆神经网络的文本情感分析方法有效
申请号: | 201910151514.X | 申请日: | 2019-02-28 |
公开(公告)号: | CN109902177B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 应捷;苏灵松;肖昊琪 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双通道 卷积 记忆 神经网络 文本 情感 分析 方法 | ||
1.一种基于双通道卷积记忆神经网络的文本情感分析方法,其特征在于,包括以下步骤:
步骤S1:将原始商品评论文本进行预处理得到训练集与测试集,所述文本包含多个单词;
步骤S2:将所述训练集中预处理好的一句所述文本进行训练,得到训练文本向量矩阵,作为神经网络双通道输入的一个通道;同时创建并通过五种词语特征词典对所述训练文本的单词进行匹配并设置情感权重值,得到所述训练文本的扩展特征向量矩阵,作为所述神经网络双通道输入的另一个通道;再将所述训练文本向量矩阵与所述扩展特征向量矩阵进行拼接,组成一个第一向量矩阵作为LSTM神经网络的输入;所述扩展特征向量矩阵的构造过程为:首先挑选对文本情感倾向影响最显著的五种词特征,然后根据每个扩展特征对情感分类的贡献强度分别赋予强度值,将这些强度值作为情感权重并赋予相应的情感权重值,将情感权重值归一化到[-1,1],最后利用扩展特征将文本映射为扩展特征向量矩阵,作为LSTM神经网络的另一个输入通道,将文本的每个词都分别与上述特征进行匹配,匹配成功时将强度值赋值给对应特征,否则赋值为0;
步骤S3:利用LSTM神经网络得到所述第一向量矩阵中每一个单词向量的上下文情感特征关系,基于该情感特征关系调整所述单词向量的情感权重值,得到矫正情感权重值,生成具有上下文情感特征关系的感情向量矩阵;
步骤S4:利用卷积神经网络CNN的3种尺寸的卷积核将所述感情向量矩阵对应的所述单词向量按不同单词数量组合方式得到多个词组序列,并筛选其中所述矫正情感权重值最高的词组序列;
步骤S5:分别对所述词组序列中每个所述感情特征的所述矫正情感权重值进行计算情感类别的概率,根据所得概率赋予对应的所述文本的文本情感标签;
步骤S6:将计算所得的文本情感标签与该文本的人工情感标记进行对比,根据对比结果通过Adam算法最小化交叉熵损失函数,调整LSTM和CNN神经网络的权重矩阵参数,使得所述文本情感标签与所述人工情感标记一致;
步骤S7:重复步骤S2-步骤S6直至所述训练集中的全部所述文本进行训练,将对应的所述扩展特征向量矩阵作为最终特征向量矩阵,将对应的所述训练文本感情向量矩阵作为最终感情向量矩阵,至此,文本情感分类模型训练完成;
步骤S8:运用训练好的文本情感分类模型对测试集文本进行情感分析,得到的文本情感分类与所述文本的人工情感标记进行对比验证,验证情感分析的准确性。
2.根据权利要求1所述的基于双通道卷积记忆神经网络的文本情感分析方法,其特征在于:
其中,步骤S1中,处理的过程包括以下子步骤:
步骤S1-1:选择预定数量的所述原始商品评论文本得到数据集;
步骤S1-2:对所述数据集进行数据清洗、分词处理以及词性标注得到预处理后的文本;
步骤S1-3:将所述预处理后的文本按预定比例分为训练集和测试集,所述训练集与所述测试集的比例为5:1-4:1。
3.根据权利要求1所述的基于双通道卷积记忆神经网络的文本情感分析方法,其特征在于:
其中,步骤S2中,得到所述第一向量矩阵包括以下子步骤:
步骤S2-1:对所述训练文本中每个单词进行词义训练得到构成词的语义词向量矩阵,作为神经网络的双通道输入的一个输入,语义词向量的训练采用Skip-gram模型训练语义词向量,该模型从目标词的上下文中选择一个单词,将所述单词作为输入,预测目标词;
步骤S2-2:所述五种词语特征词典中包含每个词的情感权重;利用五种词语特征词典对单词进行匹配并赋予相应权重,将情感权重归一化到[-1,1],得到扩展特征向量矩阵,作为神经网络双通道输入的另一个输入;
步骤S2-3:将所述训练文本向量矩阵与所述扩展特征向量矩阵拼接成一个第一向量矩阵作为神经网络的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910151514.X/1.html,转载请声明来源钻瓜专利网。