[发明专利]中文字词向量和方面词向量联合嵌入情感分析方法有效
申请号: | 201910312290.6 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110083833B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 周武能;何学辉 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种中文字词向量和方面词向量联合嵌入CNN‑LSTM情感分析模型。包括:字词向量联合嵌入表示,词向量和方面词联合嵌入表示,卷积神经网络整合句子特征和方面词特征,句子特征和方面词特征联合输入LSTM神经网络,利用LSTM的时序记忆功能对文本特征进行排序,并且添加基于方面词的注意力机制,最后用全连接层与soft‑max函数判断情感类别。由于词语中的汉字对词语的意思具有一定的表征作用,中文字词向量结合嵌入可以使共享汉字的词语之间产生了联系。方面词和评论中的词向量组合输入神经网络训练,可以提高评论内容主题情感判断的准确度。卷积神经网络将二者特征融合,进一步提高情感分析模型的准确度。 | ||
搜索关键词: | 中文 字词 向量 方面 联合 嵌入 情感 分析 方法 | ||
【主权项】:
1.一种中文字词向量和方面词向量联合嵌入情感分析方法,其特征在于,包括如下步骤:步骤一、载入中文商品评论语料库,并将语料库按比例进行分割,分为训练集和测试集;步骤二、利用jieba分词工具对训练集和测试集分别进行分词处理;步骤三、利用神经网络模型进行字词向量联合预训练,得到词语的初始化词向量和汉字的初始化字向量表示,即得到字词向量联合嵌入表示;步骤四、利用LDA模型对主题aspects进行建模,提取商品评论中的方面词,并且线性的将方面词与词向量结合,得到词向量和方面词联合嵌入表示;步骤五、将步骤三中得到的字词向量联合嵌入表示输入到卷积神经网络一提取出不同维度的特征,然后经过池化操作得到字词向量联合嵌入表示的低维特征向量;步骤六、将步骤四中得到的词向量和方面词联合嵌入表示输入到卷积神经网络二提取出不同维度的特征,然后经过池化操作得到词向量和方面词联合嵌入表示的低维特征向量;步骤七、将步骤五得到的低维特征向量和步骤六得到的低维特征向量组合加权,即分别将两个卷积神经网络得到的字词向量和方面词向量进行拼接建模,得到拼接建模向量;步骤八、利用LSTM神经网络,将步骤七得到的字词向量和方面词向量的拼接建模向量输入到LSTM中,利用LSTM的时序记忆功能对文本的特征进行排序,得到隐藏层当前的隐状态H;步骤九、LSTM输出的隐层表示与主题aspects向量拼接后作为输入,经过一层神经网络得到的新的隐层表示,给当前的隐状态添加注意力机制,通过自动加权的方式决定输入文本需要关注的部分,分别得到句子向量的概率分布;步骤十、最终的句子向量经过softmax函数判断情感类别的概率,得到情感结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910312290.6/,转载请声明来源钻瓜专利网。