[发明专利]一种面向电商评论文本的Aspect级情感分析方法有效
申请号: | 201810564582.4 | 申请日: | 2018-06-04 |
公开(公告)号: | CN109101478B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 杨鹏;张成帅;李幼平;张长江 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06K9/62;G06Q30/02 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 评论 文本 aspect 情感 分析 方法 | ||
本发明公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect‑评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。本发明不仅可以挖掘电商评论文本中的评价对象,给出细粒度的评价对象级情感分析结果;还能充分利用具体商品、商家、品牌范围内评价对象间的主题相关性,对评价对象进行聚类,进而得到评论Aspect级情感分析结果。
技术领域
本发明涉及一种面向电商评论文本的Aspect级情感分析方法,可用于实现针对电商平台中热门商品、商家、品牌的情感分析和观点挖掘等,属于互联网和自然语言处理技术领域。
背景技术
近年来,随着信息技术以及互联网的蓬勃发展,我国网购市场发展迅猛,电子商务已成为驱动我国经济发展的重要引擎。一方面,消费者在网购时无法直接接触实际商品,只能根据电商平台提供的文字、图片等描述性信息以及历史消费者发表的评论文本了解商品、商家、品牌的基本特征。另一方面,商家、品牌方也无法直接接触消费者,只能根据历史消费者发表的评论文本分析消费者的喜好,对产品设计、销售策略进行调整。然而,随着时间的推移,电商平台积聚的评论文本信息不断膨胀,碎片化、海量化特征日趋明显,采用人工的方式对电商评论文本进行情感分析需要消耗大量的人力、物力。如何充分利用信息技术不受时空限制的优势,实现面向电商评论文本的情感信息自动挖掘成为电商信息汇聚分析领域亟待解决的难题。
目前,文本情感分析领域方法众多。按照粒度的不同,可分为词语级、句子级、篇章级和Aspect级。按照原理的不同,可分为基于词典法、基于有监督机器学习法、基于图论法和基于主题模型法。然而,电商涉及的领域众多,且无社交关系,而基于有监督机器学习法和基于图论法分别依赖于领域限定的优质标注语料和用户间社交关系,难以满足电商评论文本的情感分析需求;对商家、品牌和消费者而言,只有细粒度的、针对具体Aspect的电商评论文本情感分析才更有意义,而词语级、句子级和篇章级文本情感分析方法难以充分挖掘电商评论文本的价值;电商评论文本中评价对象繁杂,主题相关性强,而传统Aspect级文本情感分析方法无法同时实现针对具体评论文本的评价对象级情感分析和评论Aspect提取(即评价对象聚类)。因此,针对此类应用,亟需设计一种细粒度的、易于领域迁移的电商评论文本情感分析方法,帮助商家、品牌和消费者深入挖掘电商评论文本中隐含的观点、喜好,进而辅助用户决策。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明提出一种面向电商评论文本的Aspect级情感分析方法ECALSA(E-Commerce Aspect-Level Sentiment Analysis)。该方法不但可以挖掘消费者在电商评论文本中具体的情感指向,给出评价对象级情感分析结果,而且可以充分利用具体商家、品牌、商品范围内评价对象的主题相关性,对评价对象进行聚类,并给出评论Aspect级情感分析结果,深入挖掘电商评论文本中隐含的观点、喜好,辅助用户决策。
技术方案:一种面向电商评论文本的Aspect级情感分析方法,简称ECALSA。首先,对从电商平台实时采集的电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect-评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。其具体步骤如下:
步骤1,电商评论文本预处理。电商评论文本预处理主要对从互联网采集的电商评论文本进行处理,使其满足后续处理过程的输入要求。该步骤具体又可以分为以下4个子步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810564582.4/2.html,转载请声明来源钻瓜专利网。