[发明专利]一种兼顾可解释性的网络虚假评论的自动识别方法及系统有效
申请号: | 201911173946.7 | 申请日: | 2019-11-26 |
公开(公告)号: | CN110941953B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 王伟军;黄英辉;刘辉 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/906;G06F16/958 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 兼顾 解释性 网络 虚假 评论 自动识别 方法 系统 | ||
1.一种兼顾可解释性的网络虚假评论的自动识别方法,其特征在于,所述兼顾可解释性的网络虚假评论的自动识别方法具体包括:
步骤一,根据想象和真实体验的不同,撰写虚假评论数据收集指导问卷,获取虚假评论数据集;
步骤二,利用谎言识别相关的语言线索框架,构建网络虚假评论撰写人的语言使用行为和心理分析框架,构建可操作的包含认知负荷、确信度、情感、感知情境细节、认知过程和洞察词汇六大类解释性的系列指标的中文网络评论语言线索指标体系;
步骤三,利用表示学习方法,获得真实与虚假网络评论在文档层次的全局性表征,构建虚假评论文本特征模型;
步骤四,整合以上分散于各个语言线索指标体系中的词法、语义、文体元,以及文本全局性表征,基于支持向量机、逻辑回归、随机森林分类器构建虚假评论自动识别模型;
步骤五,计算真实和虚假评论在所提出的可解释性语言线索维度上的值,通过显著性分析,获得具显著区别的真实和虚假评论线索特征均值;
步骤六,判定网络评论的真假,根据候选网络评论在可解释性语言线索维度上的值,与步骤五得到的特征均值进行比较,判断其维度值表现,给出虚假评论自动识别模型判定结果的解释;
步骤二中,所述中文网络评论语言线索指标体系具体包括:
所述中文网络评论语言线索指标体系包含认知负荷、确信度、情感、感知情境细节、认知过程和洞察词汇六大类解释性指标;
其中:
认知负荷是指虚假评论中个体工作记忆资源的使用量;
确信度用于反映说谎者与其陈述内容之间的距离;
情感包含说谎行为会导致的特定的负面、正面情绪和一些非指定情感相关的语言线索;
感知情境细节用于挖掘经验丰富的事件在一个复杂的包含更多的感知细节、情境和语义信息的信息网络中的相关语言线索;
认知过程和洞察词汇包含真实与谎言相关陈述事件的个体内在心理过程和洞察词汇相关语言线索。
2.如权利要求1所述兼顾可解释性的网络虚假评论的自动识别方法,其特征在于,步骤一中,所述虚假评论数据集获取方法具体包括:
所述虚假评论数据集包括真实评论数据和虚假评论数据;
真实评论数据包括在大众点评上的消费凭证以及发布的最近三个月内消费过的营业场所的真实评论数据;所述营业场所的每一条真实评论数据均包含评论评级及评论文本;
虚假评论数据,在确认没有在指定营业场所消费过的前提下,按照虚假评论收集指南的要求其撰写这些机构的虚假评论。
3.如权利要求1所述兼顾可解释性的网络虚假评论的自动识别方法,其特征在于,步骤二中,所述网络虚假评论撰写人的语言使用行为和心理,分析框架具体包括:
所述网络虚假评论撰写人的语言使用行为和心理分析框架为包含认知负荷、负面情感、心理距离、感知觉、认知过程、确定性六个方面认知心理学和社会心理学的理论框架。
4.如权利要求1所述兼顾可解释性的网络虚假评论的自动识别方法,其特征在于,步骤三,构建虚假评论文本特征模型方法包括:
使用分布式语言表征技术Skip-Gram模型,在海量网络评论数据基础上,训练网络评论的文档表示;将文档表示作为识别虚假评论的输入,结合语言线索所包含的文本的句法、语义和文体元特征构成整合的虚假评论文本特征模型。
5.如权利要求1所述兼顾可解释性的网络虚假评论的自动识别方法,其特征在于,步骤四,构建虚假评论自动识别模型方法具体包括:
构建网络评论的TF-IDF词项权重向量,并利用主成分分析进行特征降维;结合文档表示、获取到的语言线索以及TF-IDF权重向量,使用了支持向量机进行真实、虚假评论的自动分类;同时使用逻辑回归、神经网络和决策树作为基准文本分类器,并将词袋模型和现有传统语言线索模型作为基准特征集;使用标准的信息检索指标,包括准确性、召回率、F1值,量化评估分类器总体及对虚假、真实评论识别的性能;采用十折交叉验证技术来评估模型结果对于测试数据的独立性,构建虚假评论自动识别模型。
6.一种实现权利要求1~5任意一项所述兼顾可解释性的网络虚假评论的自动识别方法的信息数据处理终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911173946.7/1.html,转载请声明来源钻瓜专利网。