[发明专利]基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型在审

申请号：	201910026957.6	申请日：	2019-01-11
公开（公告）号：	CN110096587A	公开（公告）日：	2019-08-06
发明（设计）人：	姜明;张雯;张旻;汤景凡;戚铖杰;腾海滨	申请（专利权）人：	杭州电子科技大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06F17/27
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	朱月芬
地址：	310018 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	注意力机制情感分类模型嵌入的细粒度句子分类准确率局部特征情感分类文本序列准确率池化卷积向量嵌入关联输出分类引入预测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于注意力机制的LSTM‑CNN词嵌入的细粒度情感分类模型。本发明用一般的LSTM提取到的特征与指定角度的相关性不大导致情感分类准确率降低的问题。本发明采用的技术方案是，将CNN与LSTM进行结合，同时利用CNN识别局部特征的能力和LSTM利用文本序列的能力，用LSTM获取句子表示，将LSTM的输出馈送给CNN作为输入。通过CNN的卷积池化操作对LSTM提取到的特征进行选择，再引入注意力机制去重点关注句中与指定方面关联程度较高的信息，最后得到句子的预测极性。同时，为了提升分类的效率，本发明在模型中输入了指定角度的词嵌入向量，提高了分类准确率。

技术领域

本发明涉及情感分类领域，具体涉及一种基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型。

背景技术

情感分析已经被广泛应用在电商网站。对消费者评论等信息进行情感分类，不仅可以挖掘用户对商品的喜好程度，给潜在用户提供购买建议，同时有利于商家及时改善产品及服务，从而提高商业价值。为了得到一条评论对商品的不同方面的评价，由此提出了细粒度情感分类。例如对句子“菜品不错但是服务一般”的情感分析结果为“菜品：积极；服务：消极”。

细粒度情感分析过程的关键通常都始于从文本中检测与指定角度相关的信息。突出于指定角度相关性大的信息，弱化不相关或者相关性较小的信息。

现有方案利用LSTM提取句子的特征，再结合注意力机制对特征打分来表现它们对指定方面情感极性的重要程度。现有方法通常采用LSTM提取句子特征，但是每个特征对句子在给定方面的情感极性的影响程度相差不大，没有凸显出与指定角度相关性较强的特征。

发明内容

本发明的目的是针对现有技术的不足，提供一种对评论文本进行细粒度情感分类的方法。提出基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型，以解决对句子在给定角度下进行情感分析时准确率低的问题。

基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型，其特征在于包括如下步骤：

步骤1、对需要进行情感分类的评论文本进行预分类处理；

步骤2、用LSTM模型对评论进行句子表示，获得句子的特征矩阵；

步骤3、用CNN模型对步骤2得到的特征矩阵执行卷积核池化操作，筛选出特征矩阵中较为突出的句子特征；

步骤4、指定一个角度词并输入相应的词嵌入向量v_a，让模型获取指定角度词的信息；

步骤5、利用注意力机制，针对给定的角度词的信息，从已经得到的句子特征中学习与该角度相关性较大的特征，弱化不相关的特征，突出相关联的特征；

步骤6、计算得到最终的句子表示，不同数值范围对应不同的情感极性，得到评论在指定方面的细粒度情感极性。

步骤1具体实现如下：