[发明专利]一种基于改进的胶囊网络的评论文本情感分析方法在审
申请号: | 202110315537.7 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113159831A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 杨科华;杨祝武 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/12;G06F40/289;G06F40/30;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 胶囊 网络 评论 文本 情感 分析 方法 | ||
本发明涉及自然语言处理技术领域,公开了一种基于改进的胶囊网络的评论文本情感分析方法,包括评论文本搜集、评论文本预处理、文本建模将评论文本转为向量数据,利用改进的胶囊网络提取局部特征,并通过构建LSTM模型,提取文本上下文信息,最后通过softmax函数进行文本情感分类。与现有技术相比,本发明首先改进了胶囊网络的squash方法与dynamic‑Routing方法,与原有的方法相比更具有分辨性,具有更优的性能。然后基于改进的CapsNet‑LSTM模型进行评论文本的情感分析,有效的提高了评论文本情感分析的准确率,提高了情感分类的精度,该方法在酒店评论文本情感分析实验中相较于其他方法都具有较明显的优势。
技术领域
本发明涉及自然语言处理技术,具体涉及一种基于改进的胶囊网络的评论文本情感分析方法。
背景技术
随着互联网技术的飞速发展,尤其是4G、5G通信技术的成熟,带动了移动互联网时代的到来。电子商务、通信技术的发展以及普及,使得网民不再是单纯的信息接收者,更是网络数据信息的主要制造者。信息时代的便利,越来越多的网民选择在网络上评论自己对某件事情的看法。例如,在网上对住宿的酒店进行评价,这些评论往往包含了对商品质量以及服务体验的一些观点,表明用户的情感立场。在电子商务的使用场景中,其他用户的评论是用户选择该商品或者服务的重要依据,一般而言,用户在购买某项服务或某种商品前,会参考其他用户的评论来了解该商品的真实情况,从而作出自己的决定。与此同时,商家也会基于用户的评论来了解用户需求,以便于更好地制定营销策略,获取更大的利润。
评论文本情感分析方法主要有以下两种,一是基于情感词典的情感分析,二是基于机器学习的情感分析。基于情感词典的方法主要通过计算词库中标注的词语极性来计算文本的总体情感倾向,基于机器学习的情感分析主要是通过构建文本的特征向量,使用机器学习中的分类算法模型来进行评论文本的情感倾向分类。Kim等人在2014年提出卷积神经网络模型,并将其用于英文情感分类。Siwei Lai等人提出的RCNN模型,综合考虑了CNN与RNN的优点,该模型先是使用双向循环神经网络得到上下文表示,再经过卷积、池化操作后输出分类结果。总的来说,在大部分情感分类任务中,基于深度学习的分类模型比基于机器学习的分类模型有着更好的表现。但CNN模型存在的局限性仍无法避免,CNN中的卷积计算是通过低级特征的加权和来表示的,因此,它很难描述高级复杂对象的多个特征,卷积计算计算量非常大,CNN模型编码效率低。尽管CNN使用池化层来处理这些问题,但池化操作同样存在些许不足。虽然池化操作可以降低卷积计算的复杂度,但池化操作更像是一种静态路由,在池化过程中特征间的上下文信息会丢失,无法反映出特征的部分-整体这一映射关系。
胶囊网络(Capsule network)采用胶囊来表示特征,使用动态路由机制来代替CNN中的池化操作,动态路由对提取到的所有特征进行加权平均,而不像CNN最大池化那样只将最好的特征传递给上层,从一定程度上克服了CNN的弊端。胶囊网络在图像识别方向的研究较多,在自然语言处理方向的应用较少。本发明针对文本情感分类特性,提出了一种适用于情感分析的胶囊网络模型。
发明内容
发明目的:针对现有技术中存在的不足问题,本发明提供了一种基于改进的胶囊网络的评论文本情感分析方法,改进了胶囊网络的squash方法、dynamic-Routing方法,以及提出了一种基于改进后的胶囊网络的CapsNet-LSTM模型来进行情感分析,该模型有效的提高了短文本情感分析分类的准确率。
技术方案:本发明提供了一种基于改进后的胶囊网络的评论文本情感分析分类方法,包括如下步骤:
步骤1:获取酒店评论数据集,并进行数据预处理,包括数据清洗,设置标签,保留情感语义词;
步骤2:对预处理后的评论文本使用word2vec进行词嵌入向量化建模,将文本转化为包含特征的词向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110315537.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种外开侧滑铰链及外开窗结构
- 下一篇:一种针对增量配电业务投资的测算模型