[发明专利]一种汽车口碑的情感分析方法和装置有效
申请号: | 202010903683.7 | 申请日: | 2020-09-01 |
公开(公告)号: | CN112101033B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 陈晶;李奏换;卢春霞;黎秋怡;刘丹;梁维新 | 申请(专利权)人: | 广州威尔森信息科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06K9/62;G06Q10/06;G06F9/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨小红 |
地址: | 510623 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汽车 口碑 情感 分析 方法 装置 | ||
本申请公开了一种汽车口碑的情感分析方法和装置,其中方法包括:获取汽车口碑数据;基于自然语言处理,对汽车口碑数据处理得到样本数据;基于样本数据构建训练集和测试集;基于样本数据,构建各汽车配置项分别对应的正、中、负三个情感极性的隐马尔可夫模型;通过训练集和测试集训练隐马尔可夫模型,并保存训练后的各隐马尔可夫模型;获取新汽车口碑数据,并基于保存的隐马尔可夫模型对新汽车口碑数据进行基于汽车配置项的情感极性分析,得到情感分析结果;基于预置指标维度,汇总情感分析结果对应的指标维度结果后进行展示,解决了自然语言导致后期维护量大且麻烦的困扰和传统机器学习方式导致的样本数据不全面引发的过拟合的技术问题。
技术领域
本申请涉及汽车数据分析技术领域,尤其涉及一种汽车口碑的情感分析方法和装置。
背景技术
随着网络社交媒体的快速发展,情感分析已经成为自然语言处理(NLP)中最活跃的研究领域之一。无论是个人还是企业,本实施例常常需要借助于别人的意见做出决定。因此,情感分析的重要性引发整个社会的共同关注。
在汽车这个细分领域中,用户买车、用车过程中会发表海量评论(即汽车口碑数据),企业希望可以自动挖掘出评论中用户的评价态度,以正确分析客户情感,精准定位产品问题,进而满足客户需求。
现有技术中汽车口碑的情感分析方法主要有:通过手工打标签,然后对整段评论建分类模型,判断整体的情感极性;或是调用目前一些开放的接口,如百度AI接口,进行整段评论的情感极性判断;或是对评论从整体到部分,如将文本按主题进行划分,再提取主题下特征信息,判断情感极性。
然而上述的现有情感分析方法存在如下缺点:
(1)虽然对整段评论进行情感极性判断的准确率会普遍偏高,但得出的结论比较笼统,无法进一步得出具体的改善方向,比如用户讲“空间”方面的评价,只能得出对“空间”整体的情感极性是“正、中、负”其中一个,无法得知是“前排空间”、“后排空间”还是“头部空间”的问题,且手工打标签,很难保证样本的丰富度,容易导致过拟合。
(2)调用现有情感极性判断接口,限制多,并且无法进行词典优化,质量提升空间有限。
(3)当一条评论中主题不唯一时,每个主题下的特征会出现交叉现象,比较难确定特征的唯一性,导致主题的情感极性判断可能错误。
发明内容
有鉴于此,本申请提供了一种汽车口碑的情感分析方法和装置,解决了自然语言导致后期维护量大且麻烦的困扰和传统机器学习方式导致的样本数据不全面引发的过拟合的技术问题。
本申请第一方面提供了一种汽车口碑的情感分析方法,包括步骤:
S1、从汽车平台获取用于训练和测试的汽车口碑数据;
S2、基于自然语言处理,对所述汽车口碑数据进行汽车配置项、情感词、程度词、否定词的实体抽取,并对所述汽车配置项所在切割语料的情感极性进行判断后得到样本数据,其中,所述切割语料为基于所述汽车配置项对所述汽车口碑数据进行切割后得到的;
S3、对所述样本数据中的所述汽车配置项、所述情感词、所述程度词和所述否定词进行分层抽样,并基于抽样的数据构建训练集和测试集;
S4、基于所述样本数据,构建各汽车配置项分别对应的正、中、负三个情感极性的隐马尔可夫模型;
S5、通过训练集训练所述隐马尔可夫模型,直至训练后的所述隐马尔可夫模型对所述测试集的预测准确率满足预设条件,停止训练,并保存训练后的各所述隐马尔可夫模型;
S6、获取新汽车口碑数据,并基于保存的所述隐马尔可夫模型对所述新汽车口碑数据进行基于所述汽车配置项的情感极性分析,得到所述新汽车口碑数据对应的情感分析结果;
S7、基于预置指标维度,汇总所述情感分析结果对应的指标维度结果后,展示所述指标维度结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州威尔森信息科技有限公司,未经广州威尔森信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010903683.7/2.html,转载请声明来源钻瓜专利网。