[发明专利]基于双通道卷积记忆神经网络的文本情感分析方法有效
申请号: | 201910151514.X | 申请日: | 2019-02-28 |
公开(公告)号: | CN109902177B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 应捷;苏灵松;肖昊琪 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双通道 卷积 记忆 神经网络 文本 情感 分析 方法 | ||
根据本发明所涉及的基于双通道卷积记忆神经网络的文本情感分析方法,因为将测试集中的文本同时进行词义训练与情感训练分别得到词向量矩阵与扩展特征向量矩阵,再将词向量矩阵与扩展特征向量矩阵进行计算得到训练文本向量矩阵,再将训练文本向量矩阵通过LSTM训练得到具有上下文关系的训练文本感情向量矩阵,将训练文本感情矩阵通过CNN处理得到训练文本情感分类,再将训练文本情感分类通过与对应文本的人为感情评价进行自调整。
技术领域
本发明属于自然语言处理技术领域,具体涉及一种基于双通道卷积记忆神经网络的文本情感分析方法。
背景技术
随着我国电子商务的健康发展,流量红利期已过,客户成本越来越高。电子商务企业如何识别客户消费偏好,开展精准营销,降低竞争成本,是每个企业必备功课。商品评论数据是电子商务交易完成后,客户对产品的质量、价格、服务等方面的评价。商品评论数据已成为企业获取客户消费偏好、开展精准营销的重要信息来源。这种评价集往往带有很强的情感倾向。研究客户的情感倾向既能度量客户对企业的认可度,也能挖掘客户的消费偏好。目前,文本情感分析领域主要分为三个研究方向。第一个是基于规则和词典的方法:这种方法借助人工构建的情感词典和专家总结的规则来识别文本的情感,一般不考虑词之间的语义关联,仅仅是将文本看成是词与词的集合。基于情感词典的文本情感分类方法性能过于依赖词典的质量,对网络新词和表情符号的区分能力不强。第二个是基于机器学习的方法:此方法运用机器学习分类器,通过人工选择的语言学特征进行训练,用训练好的分类器识别文本的情感,常用的分类器有朴素贝叶斯、最大熵模型、支持向量机,常用的语言学特征有词袋模型、词性特征、否定词特征等。第三个是基于深度学习的方法:此种方法运用神经网络模型,通过在训练集上的训练自动学习得到用于分类的情感特征,然后用训练好的神经网络模型识别文本的情感。由此产生的常用相关技术方法有:(1)运用word2vec工具得到文本的词向量表示,输入到训练好的卷积神经网络(convolutin neural network,CNN)中,得到商品评论文本的情感倾向。(2)将对抗式训练应用到文本情感分析领域,结合CNN,提高了在处理对抗样本时的鲁棒性。(3)利用情感词典得到文本的情感极性分值结合word2vec得到的词向量,得到有“情感信息”的特征向量,再输入CNN中进行训练。以上三个专利都只在模型的输入层进行优化,再用CNN进行情感判定,而本文对神经网络进行优化,融合了LSTM(Long Short Term Memory)神经网络和CNN,提高了文本情感分析的准确度。(4)采用word2vec工具得到文本的词向量表示,将其输入LSTM神经网络得到具有上下文语义关系的词向量,再输入CNN提取特征,最后通过softmax(归一化)层得到文本情感类别。(5)选用词语特征与词向量作为双通道输入,接着用CNN进行文本情感分类,(6)联合使用CNN和LSTM对词向量进行处理。
深度学习适合做文本情感分析是因为深度学习结构灵活,其底层词嵌入技术能避免文本长短不均带来的处理困难,使用深度学习抽象特征,能避免大量人工提取特征的工作。技术方法(1)-(3)和技术方法(5)都只在模型的输入层进行优化,再用CNN进行情感判定,技术方法(4)、(6)的在神经网络的输入层的输入对文本情感信息表示较简单造成对文本情感分析的准确率不高。
发明内容
本发明是为了解决上述问题而进行的,提供了一种基于双通道卷积记忆神经网络的文本情感分析方法,具有这样的特征,包括以下步骤:
步骤S1:将原始商品评论文本进行预处理得到训练集与测试集,文本包含多个单词;
步骤S2:将训练集中预处理好的一句文本进行训练,得到训练文本向量矩阵,作为神经网络双通道输入的一个通道;同时创建并通过五种词语特征词典对训练文本的单词进行匹配并设置情感权重值,得到训练文本的扩展特征向量矩阵,作为神经网络双通道输入的另一个通道;再将训练文本向量矩阵与扩展特征向量矩阵进行拼接,组成一个第一向量矩阵作为LSTM神经网络的输入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910151514.X/2.html,转载请声明来源钻瓜专利网。