[发明专利]基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型在审
申请号: | 201910026957.6 | 申请日: | 2019-01-11 |
公开(公告)号: | CN110096587A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 姜明;张雯;张旻;汤景凡;戚铖杰;腾海滨 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力机制 情感分类模型 嵌入的 细粒度 句子 分类准确率 局部特征 情感分类 文本序列 准确率 池化 卷积 向量 嵌入 关联 输出 分类 引入 预测 | ||
本发明公开了基于注意力机制的LSTM‑CNN词嵌入的细粒度情感分类模型。本发明用一般的LSTM提取到的特征与指定角度的相关性不大导致情感分类准确率降低的问题。本发明采用的技术方案是,将CNN与LSTM进行结合,同时利用CNN识别局部特征的能力和LSTM利用文本序列的能力,用LSTM获取句子表示,将LSTM的输出馈送给CNN作为输入。通过CNN的卷积池化操作对LSTM提取到的特征进行选择,再引入注意力机制去重点关注句中与指定方面关联程度较高的信息,最后得到句子的预测极性。同时,为了提升分类的效率,本发明在模型中输入了指定角度的词嵌入向量,提高了分类准确率。
技术领域
本发明涉及情感分类领域,具体涉及一种基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型。
背景技术
情感分析已经被广泛应用在电商网站。对消费者评论等信息进行情感分类,不仅可以挖掘用户对商品的喜好程度,给潜在用户提供购买建议,同时有利于商家及时改善产品及服务,从而提高商业价值。为了得到一条评论对商品的不同方面的评价,由此提出了细粒度情感分类。例如对句子“菜品不错但是服务一般”的情感分析结果为“菜品:积极;服务:消极”。
细粒度情感分析过程的关键通常都始于从文本中检测与指定角度相关的信息。突出于指定角度相关性大的信息,弱化不相关或者相关性较小的信息。
现有方案利用LSTM提取句子的特征,再结合注意力机制对特征打分来表现它们对指定方面情感极性的重要程度。现有方法通常采用LSTM提取句子特征,但是每个特征对句子在给定方面的情感极性的影响程度相差不大,没有凸显出与指定角度相关性较强的特征。
发明内容
本发明的目的是针对现有技术的不足,提供一种对评论文本进行细粒度情感分类的方法。提出基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型,以解决对句子在给定角度下进行情感分析时准确率低的问题。
基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型,其特征在于包括如下步骤:
步骤1、对需要进行情感分类的评论文本进行预分类处理;
步骤2、用LSTM模型对评论进行句子表示,获得句子的特征矩阵;
步骤3、用CNN模型对步骤2得到的特征矩阵执行卷积核池化操作,筛选出特征矩阵中较为突出的句子特征;
步骤4、指定一个角度词并输入相应的词嵌入向量va,让模型获取指定角度词的信息;
步骤5、利用注意力机制,针对给定的角度词的信息,从已经得到的句子特征中学习与该角度相关性较大的特征,弱化不相关的特征,突出相关联的特征;
步骤6、计算得到最终的句子表示,不同数值范围对应不同的情感极性,得到评论在指定方面的细粒度情感极性。
步骤1具体实现如下:
1.1将爬取自网络的评论信息整合成数据集;
1.2对数据集进行清洗:去掉标点符号、表情符、英文字符,然后引用停用词典去掉停用词;
1.3用现有的分词工具LTP对清洗后的数据集中的每一条评论进行分词;
1.4用W2V词向量模型将分词后的每一条评论表示为词向量形式s=[w1,w2,...,wN],N是句子长度,wi是词向量。
步骤2具体实现如下:
2.1用一个初始的LSTM模型对固定长度的句子输入进行编码,如果句子编码后的向量长度不够,则末尾用数字0进行补齐;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910026957.6/2.html,转载请声明来源钻瓜专利网。