[发明专利]基于多维评论表示的虚假评论检测方法有效
申请号: | 202011505843.9 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112597302B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 刘美玲;尚玥;于洋 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/237;G06F40/253;G06F40/284;G06K9/62;G06N3/04 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 评论 表示 虚假 检测 方法 | ||
1.基于多维评论表示的虚假评论检测方法,其特征在于:所述的检测方法包括以下步骤:
步骤1、提取细粒度方面词集:
首先,对评论语句进行预处理,提取评论语句中词性为名词且词频大于词频阈值的所有单词构成细粒度方面词集1;
然后,将评论中所包含的细粒度方面词视为当前评论句子中的主题,采用LDA主题挖掘模型结合主题困惑度计算对已有的评论集进行细粒度方面词的提取,得到细粒度方面词集2;
最后,将得到的细粒度方面词集1和细粒度方面词集2进行去重合并,得到最终的细粒度方面词集
步骤2、构建词级融合模型:
通过用户ID信息、产品ID信息和细粒度方面词分别与评论文本中的单词基于注意力机制进行计算,获取用户级相关特征、产品级相关特征和细粒度方面级相关特征;
步骤3、构建句级交互模型:
步骤3.1、利用双向LSTM+max-pooling层作为基础模型,获取评论句子表示h:
步骤3.2、根据词级融合模型输出的用户级相关特征表示vuc、产品级相关特征表示vpc和细粒度方面级相关特征表示vaspect得到用户句子表示U、产品句子表示P以及细粒度方面句子表示A;
步骤3.3、将用户句子表示U与产品句子表示P拼接在一起生成用户-产品级句子表示,将细粒度方面句子表示A作为约束门,分别对评论句子表示h与用户-产品级句子表示UP传向下一层的信息进行约束,并将细粒度方面句子表示A分别融入包含丰富上下文信息h与用户-产品知识的评论表示UP′中,基于注意力机制计算包含丰富上下文信息h与用户-产品知识的评论表示UP′之间的交互影响,并获得最终的评论表示Fr;
步骤4、构建分类模型:
对句级交互模型输出的最终的评论表示Fr进行分类,判断评论是虚假评论还是真实评论。
2.根据权利要求1所述的基于多维评论表示的虚假评论检测方法,其特征在于:所述的步骤1中,对评论语句进行预处理的方式为:利用语法和形态分析工具对分词后的评论语句进行处理。
3.根据权利要求2所述的基于多维评论表示的虚假评论检测方法,其特征在于:所述的步骤1中,获得细粒度方面词集2的具体步骤如下:对评论语料进行语法和形态分析,然后利用语法和形态分析工具对分词后的评论语句进行预处理,通过LDA主题挖掘模型对预处理之后的评论集进行建模,采用困惑度最小时的主题数来确定每个评论集中的主题数,将确定的所有主题下的所有词全部进行整合,从而得到细粒度方面词集2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011505843.9/1.html,转载请声明来源钻瓜专利网。