[发明专利]基于多维评论表示的虚假评论检测方法有效
申请号: | 202011505843.9 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112597302B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 刘美玲;尚玥;于洋 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/237;G06F40/253;G06F40/284;G06K9/62;G06N3/04 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 评论 表示 虚假 检测 方法 | ||
基于多维评论表示的虚假评论检测方法,属于信息挖掘技术领域。本发明是为了解决现有的虚假评论检测方法不能真实的、自动的、准确的解决电子商务平台中的商品评价信息处理的问题。本发明从词级和句子级将用户级相关特征表示、产品级相关特征表示和细粒度方面级相关特征表示进行融合,并对用户与产品之间的关系进行建模,将关系融入模型之中;基于注意力机制计算包含丰富上下文信息h′与用户‑产品知识的评论表示UP′之间的交互影响,获得最终的评论表示Fr,然后进行分类,进而判断评论是虚假评论还是真实评论。主要用于虚假评论的检测。
技术领域
本发明涉及一种基于多维评论表示的虚假评论检测方法,属于信息挖掘技术领域。
背景技术
随着网络的飞速发展,用户使用网络的便捷性在不断上升。现如今,网络已不仅仅是人们获取知识的工具,同时还是人们发表观点和传播信息的载体。在电子商务方面,评论信息对网络平台中的用户与企业都影响重大,一方面影响着用户的购买决策,另一方面影响着企业的发展。据社交商务平台Bazaarvoice最新数据发现,超过50%的用户在发现产品有虚假评论后会停止购买行为,失去对品牌的信任。而针对虚假评论,据《华盛顿邮报》研究,亚马逊网站中电子产品的评论超过60%为虚假评论。正因此,自动鉴别网络平台信息的真假、给用户提供更加真实的信息至关重要。
现有的虚假评论的检测方法主要分为两种:一种是基于特征工程的虚假评论的检测方法,此方法多从文本特征和行为特征入手,例如在文本的语义特征方面包括评论文本的长度、词性特征和情感极性等,在用户行为特征方面包括好/差评论的发表数量,发表评论的频率等,然而在利益的驱使下,这些特征容易被虚假评论发布者反侦破,再伪装,虚假评论发布者的计策针对相应的检测特征也在不断提升和伪装;另一种是基于深度学习的虚假评论的检测方法,此方法相比基于特征的方法,能够自动识别文本内部隐含的特征,而不需要人工设计,具有更强的领域适应性,更为有效,但大多仅从单一的评论文本或用户角度出发,而忽略了用户自身隐含的一些表达模式以及用户、产品与文本三者之间的关联与影响;除此之外,我们发现用户在表达自己的真实感受的时候,无论是好评还是差评,都会从一些细节方面来描述说明,以此增强自己情感的表达,而虚假评论发布者因并非自己亲身经历或真实使用,并不能从细节处描述产品,大多是笼统的评论。
基于以上原因,在网络数据量飞速增长的环境下,提供一个自动的、准确的且不易被虚假评论发布者反侦破的虚假评论检测方法是解决电子商务平台中的商品评价信息处理的技术问题的关健。
发明内容
本发明是为了解决现有的虚假评论检测方法不能真实的、自动的、准确的解决电子商务平台中的商品评价信息处理的问题。现提供一种基于多维评论表示的虚假评论检测方法。
基于多维评论表示的虚假评论检测方法,包括以下步骤:
步骤1、提取细粒度方面词集:
首先,对评论语句进行预处理,提取评论语句中词性为名词且词频大于词频阈值的所有单词构成细粒度方面词集1;
然后,将评论中所包含的细粒度方面词视为当前评论句子中的主题,采用LDA主题挖掘模型结合主题困惑度计算对已有的评论集进行细粒度方面词的提取,得到细粒度方面词集2;
最后,将得到的细粒度方面词集1和细粒度方面词集2进行去重合并,得到最终的细粒度方面词集
步骤2、构建词级融合模型:
通过用户ID信息、产品ID信息和细粒度方面词分别与评论文本中的单词基于注意力机制进行计算,获取用户级相关特征、产品级相关特征和细粒度方面级相关特征;
步骤3、构建句级交互模型:
步骤3.1、利用双向LSTM+max-pooling层作为基础模型,获取评论句子表示h:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011505843.9/2.html,转载请声明来源钻瓜专利网。