[发明专利]一种评论情感分析方法、系统、电子设备及存储介质在审
申请号: | 202110690966.2 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113449519A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 白强伟;黄艳香 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 李红岩 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 情感 分析 方法 系统 电子设备 存储 介质 | ||
本发明提出一种评论情感分析方法、系统、电子设备及存储介质,其方法技术方案包括获取一评论集合,使用一情感模型对所述评论集合进行情感极性判断,得到对应的情感极性标签;为所述评论集合中的评论计算归因分数向量,并得到对应的归因分数向量集合,所述归因分数向量包括所述评论中每个字的归因分数;根据所述归因分数向量抽取所述评论的关键词;根据所述情感极性标签和所述关键词以可视化的形式进行展示。本申请解决了现有评论情感分析方法无法同时满足不需要标注、与情感极性相关、区分多义词、不限定词范围的问题。
技术领域
本发明属于自然语言处理领域,尤其涉及一种评论情感分析方法、系统、电子设备及存储介质。
背景技术
随着移动互联网的发展,出现了各种各样的APP帮助人们解决衣食住行等各方面的需求。这些APP为了提升用户体验通常都提供了用户评论的功能。如何通过这些用户的评论来指导产品或者服务的改进是一个十分有挑战且有意义的任务。
情感分析(Sentiment Analysis)是一种常见的分析用户评论的方法,其主要目标是判断用户评论的情感极性(正面、负面等)。目前,主要使用文本分类模型对评论的情感极性进行判断。但是,仅有评论的情感极性无法为改进产品或者服务提供更加深入的洞见。因此,本专利提出了一种基于关键词的评论情感分析方法,该方法能够更加精准的解释导致情感极性的原因,为进一步改善产品或者服务提供有效的洞察。
目前最常见的解释评论情感的方法是基于关键词的。举例来说,如果要快速了解某产品近期导致负面评论的原因,可以对近期的负面评论进行关键词抽取,然后将高频关键词通过可视化的方法展示给用户,这样就能帮助用户快速定位导致负面评论的原因。但上述方法具有下列缺陷:
(1)有监督的关键词抽取方法需要大量的人工标注,其不但成本高昂且无法很好的抽取出未标注类型的关键词;
(2)基于情感词典的关键词抽取只能抽取情感词典中存在的单词,不存在的单词则无法被抽取。此外,该方法也无法对多义词进行识别,例如在评论“不好意思,这个产品真的不好用!”中存在2个“不好”,但只有“不好用”中的“不好”才导致了负面情感,但是基于情感词典的方法无法识别这两种情况。
(3)基于TF-IDF或者TextRank的关键词抽取方法是独立于评论情感的,也就是说抽取的关键词并不一定与评论情感相关。
发明内容
本申请实施例提供了一种评论情感分析方法、系统、电子设备及存储介质,以至少解决现有评论情感分析方法无法同时满足不需要标注、与情感极性相关、区分多义词、不限定词范围的问题。
第一方面,本申请实施例提供了一种评论情感分析方法,包括:情感极性判断步骤,获取一评论集合,使用一情感模型对所述评论集合进行情感极性判断,得到对应的情感极性标签;归因分数计算步骤,为所述评论集合中的评论计算归因分数向量,并得到对应的归因分数向量集合,所述归因分数向量包括所述评论中每个字的归因分数;关键词抽取步骤,根据所述归因分数向量抽取所述评论的关键词;评论情感展示步骤,根据所述情感极性标签和所述关键词以可视化的形式进行展示。
优选的,所述归因分数计算步骤进一步包括:基于积分梯度法计算所述评论的所述归因分数向量,公式为
式中,为所述评论集合中一评论的归因分数向量,为情感模型,x为所述评论集合中的一条所述评论,x=(x1,x2,...,xn),其中xi表示评论的第i个字,y为x所对应的情感极性;
将所述归因分数向量进行标准化,公式为
式中,||·||表示向量的L2范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110690966.2/2.html,转载请声明来源钻瓜专利网。