[发明专利]一种基于情感词向量的汽车在线评论情感分析方法在审
申请号: | 202110425629.0 | 申请日: | 2021-04-20 |
公开(公告)号: | CN112966526A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 刘露;姚志林;费玉玺;包铁;彭涛 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/9536;G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 曹书华 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 向量 汽车 在线 评论 分析 方法 | ||
本发明公开的属于汽车在线评论技术领域,具体为一种基于情感词向量的汽车在线评论情感分析方法,其包括:输入层;特征学习层;注意力层;情感分类层。该基于情感词向量的汽车在线评论情感分析方法,在已构建的特定汽车评论文本数据集上进行上述方法的实验分析,使得该模型能够更好的抽取关于汽车评论文本的特征,提升该模型在汽车领域文本评论情感倾向分析的准确率;通过设计对比实验,在汽车领域的文本评论分类准确率以及F1值相较于传统的情感分类方法取得了有效改善,具有一定的应用价值。
技术领域
本发明涉及汽车在线评论技术领域,具体为一种基于情感词向量的汽车在线评论情感分析方法。
背景技术
随着我国的经济水平飞速发展,互联网在国内的普及度日益提高,而与此同时人民生活质量也在不断改善。日益向好的发展趋势促使汽车这一种重要的交通运输工具,也逐渐进入了千家万户。同时,汽车制造业正逐渐向智能化、信息化转变,而人们消费意识的提高,对于汽车这一类大型商品的综合要求也在不断发生着变化,因此对于汽车服务商而言,了解用户的个性化需求,精准掌握市场动向,从而制定合理的企业营销策略具有重大意义。
目前,在国内已经出现了多个具有一定专业性的汽车门户网站,这些网站的用户保持着极高的活跃度和积极性,由此便产生了海量的用户在线评论数据。对于汽车服务商而言,不同的用户对于某一汽车商品的评价具有极高的商业价值信息,而面对如此多的评论数据,如果仅依靠人工进行文本的分析和挖掘,无疑是一件非常庞大且繁复的工作。如果能够自动从汽车评论文本中学习文本特征,从而实现情感信息提取,并通过分类模型对汽车评论做出情感倾向的判断,进而能够对评论中的正面评价和负面评价进行挖掘,便可以获取更深层次的关键信息,从而更为客观的了解用户的需求,极大的减少了汽车企业了解市场动向的人力成本和时间成本,给予了企业更为灵活的决策方案。
目前国内外针对情感分析任务的主流研究方法主要有3种,分别是(1)基于情感词典和规则的分类方法;(2)基于传统机器学习的分类方法;(3)基于深度学习的分类方法。这三种流行方法在一定程度上都存在各自缺陷:
(1)基于词典的方法是利用情感知识来尽可能完整地创建相应的情感词典,然后依据规则进行文本对照,进而计算得到文本的情感类型。情感词典被用于融合语言资源,其中每个单词与指示其情感极性的分数相关。但是由于情感词典自身不能考虑上下文对与单词关联的极性值的影响,因此它们只能在识别大型数据集中的粗略意见倾向上获得良好的性能。
(2)基于机器学习的情感分类方法大体可分为有监督式和半监督式的两类机器学习算法,虽然这其中不乏性能较为优异的分类模型,但由于这些分类模型的性能通常取决于标注数据集的质量,而高质量的标注数据集往往需要付出大量的人工成本才能得到。这样便造成了机器学习方法更多的受限于复杂的特征工程,并且依赖人工数据集的设计,导致分类在某一领域表现良好但在其他领域却不尽然,因此在大规模推广方面存在阻力。
(3)相对于前两种情感分析方法,深度学习技术在自动化的捕获文本特征方面取得了巨大进步,但就目前的模型应用现状来看,词向量的表征能力对模型的分类效果至关重要。而目前性能表现突出的词向量预训练模型如Bert,在情感信息表征能力上仍存在不足,致使在解决情感分析任务时,语言模型往往仅能够学习文本数据的语义信息,而忽略了文本中所蕴含的情感信息,这对模型来说无疑是巨大的损失。
基于对上述问题的思考及分析,本发明在深度学习技术的基础上,保留其自动化捕获文本特征能力的同时,提出改进创新方式,设计一种基于情感词向量的汽车在线评论情感分析方法。
本发明首先在传统词向量训练模型中进行改进,考虑在预训练阶段加入情感信息作为先验知识,让模型在捕获文本特征的同时,能通过学习目标词的上下文,并将其所蕴含的情感信息准确预测出来,最终通过大规模的预训练任务,提升模型的表征能力。其次,在自动学习文本语义特征的基础上尝试加入注意力机制Attention,将Attention所具有的特定选择能力加入到文本特征抽取过程中,提升基础模型对特征情感词的关注度,从而有效改善文本情感分析算法的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110425629.0/2.html,转载请声明来源钻瓜专利网。