[发明专利]一种面向网购评论的新情感词极性计算方法有效
申请号: | 202010087342.7 | 申请日: | 2020-02-11 |
公开(公告)号: | CN111310455B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张顺香;余宏斌;许汗清;王侨云;朱海洋 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 232001 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 评论 情感 极性 计算方法 | ||
本发明公开一种面向网购评论的新情感词极性计算方法,该方法包括:获取网购平台的商品主体、属性集合及其评论语料;用增强点互信息算法结合评论中出现的星级好评概率计算得出商品主体的满意度;用增强点互信息分别计算得出商品属性的满意度、商品主体与新词的关联度和商品属性与新词的关联度,最后得出新词情感极性的弱标签。分别用朴素贝叶斯公式和增强点互信息计算新词情感权值,并结合弱标签加权求得新情感词极性。本发明的方案从新词组成、上下文已知情感词的共现和面向网购领域的弱标签这三个层面综合计算新情感词极性。
技术领域
本发明涉及文本分析技术领域,具体是一种面向网购评论的新情感词极性计算方法。
背景技术
随着互联网技术的发展,网络上出现了越来越多的用户原创内容例如网络商店中用户对商品或卖家的评论。这些评论是用户对商品领域内的具体对象的看法和意见。其中,这些看法和意见通常借助情感词表述出来,可能是正向情感、负向情感或中性情感。通过分析评论中的情感词,就能够确定用户对相应对象的认可程度。但是随着时代的发展,用户在评论中会使用一些未被情感词典收录的新情感词,这些新情感词的极性未知。
目前,常通过以下两个层面分析新情感词极性:1.利用情感词典,包含新情感词的文本等资源,以新情感词和已知情感词的共现或相似,计算新情感词的极性,但这种方法只是通过上下文计算新词情感极性;2.从新词的组成字是情感词组成字的概率考虑,即通过字的情感权重计算新情感词的极性。这种方法忽视了上下文对词项具体含义的影响,更没有考虑某领域对新词情感极性的影响。
为了综合上述两种方法的优点,弥补两者的不足,本发明提出一种面向网购评论的新情感词极性计算方法,多层面更准确地分析计算。
发明内容
本发明的目的是提供一种面向网购评论的新情感词极性计算方法;该方法提出面向商品网购评论的新情感词极性弱标签计算方法,多角度计算新词情感极性,从而能够更全面的计算出新情感词的极性。
本发明实现发明目的采用如下技术方案:
本发明提供的一种面向网购评论的新情感词极性计算方法,其特征在于:从词组成角度用朴素贝叶斯公式计算新词组成字是情感词组成字的概率,进而计算出新词情感权值,从新词与已知情感词共现的角度,用增强点互信息计算新词情感权值,结合面向购物领域的新词情感弱标签加权求得新情感词极性。
作为优选,上述的面向购物领域的新词情感弱标签,其特征在于:用增强点互信息算法结合评论中出现的星级好评概率计算得出商品主体的满意度;用增强点互信息计算得出商品属性的满意度、商品主体与新词的关联度和商品属性与新词的关联度,最后加权计算出新词情感极性的弱标签。
本发明与现有技术相比,其有益效果体现在:本方案不仅从上下文角度考虑新情感词与各已知情感词之间的同现关系,也从新情感词组成角度,面向商品购物领域的弱标签多角度综合计算新情感词的极值。避免了只从上下文角度计算新情感词的不足,或只从新情感词的构成计算其情感极性的弊端。
附图说明
图1是本发明的总体流程图;
图2是弱标签S1计算流程图;
图3是候选情感词权重S2计算流程图;
图4候选情感词权重S3计算流程图;
图5新情感词极值S计算流程图。
具体实施方式
以下结合附图与具体实施步骤对本发明做进一步解释说明,如图1所示,本发明的总体流程包含以下步骤。
步骤1:选择一定数量的网购评论语料,对初始文本数据执行预处理操作,包括分词,词性标注,以及新词发现,从而确定候选情感词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087342.7/2.html,转载请声明来源钻瓜专利网。