[发明专利]基于事件与传播结构的谣言检测方法有效
申请号: | 202110903231.3 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113343126B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 梁刚;杨进;高玉君;许春;蒋方婷;奚金霞;李劭 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/30;G06N3/04 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾;贺立中 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 事件 传播 结构 谣言 检测 方法 | ||
本发明公开了基于事件与传播结构的谣言检测方法,提取每个事件中的源帖信息,并通过基于情感极性的双向编码器表示技术对源帖信息进行文本数据增强;然后构建传播关系,同时,将增强后的文本向量特征加入到传播关系的根节点中,与传播关系结合,形成树型传播结构,再从根节点开始,通过转发及响应关系而形成的自前向后的正向树型传播结构和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构分别输入到FRBi‑GCN中;最后,对传播树中包含根节点以及转发节点在内的所有节点进行节点增强操作,并通过softmax分类器鉴别出该事件是否是谣言。
技术领域
本发明涉及谣言识别技术领域,具体的说,是基于事件与传播结构的谣言检测方法。
背景技术
社会网络爆炸式的发展使得以微博、Twitter、微信等为代表的社会网络已逐渐取代传统媒体成为人们发布和获取信息的一个重要平台。社会网络中的信息具有传播速度快,范围广,即时性强等优点。然而,由于发布信息时缺乏有效的监管手段,导致社会网络平台同时也成为谣言传播的温床。根据新浪微博2021年发布的《微博辟谣2020年度报告》显示,三分之一的谣言始发于社会网络。这些信息在未经处理的情况下可能被迅速地歪曲和放大,从而误导公众。谣言无节制地在网络上传播不仅影响社会和谐与稳定。因此,快速有效地检测出社会网络谣言,对净化网络环境,维护公共安全至关重要。
现有的谣言检测方法可以归纳为三类:
1)人工检测方法
人工谣言检测方法就是平台将社会网络中的可疑信息交给经验丰富的编辑或是行业专家,利用编辑和专家的领域知识和经验对信息的真实性进行甄别。当前的主流社会网络平台,如Twitter、Facebook与新浪微博,在其平台上都是采用人工的谣言检测方法。该方法的优点是简单、准确率高。缺点是需要检测者对用户或平台举报的信息进行逐条判断,单靠人力对每天产生的数以亿计的数据进行检测,具有明显的滞后性,且检测的质量依赖于检测者的知识背景与经验,对个人的知识与经验要求极高,也有可能因为个人因素而造成误判。
2)基于机器学习的检测方法
基于机器学习的检测方法。早期对谣言的自动检测主要集中在利用机器学习技术来检测谣言,该类方法主要包含三个流程:首先,从训练数据集中选择并提取能够有效表征数据的特征;其次,利用选择与提取的特征在训练数据集上训练分类模型;最后,使用训练好的模型对训练数据集外的数据进行预测,经过不断的评估与优化,判断数据是否是谣言。对于基于机器学习的谣言检测方法而言,如何选择与提取出显著的特征来表征数据对谣言检测效果至关重要,其优点是相对简单且具有一定的可解释性。缺点是依赖人工进行特征的选择,耗费人力物力的同时,得到特征向量的鲁棒性较差。且试图用一套通用的特征集合表征社会网络不同平台不同语言中的全部信息,训练出来的谣言分类器容易陷入过拟合状态,导致检测准确度不高。
3)基于深度学习的检测方法
深度学习具有很强的特征学习能力,其模型学习的特征比传统机器学习算法中通过特征工程得到的特征数据对原数据具有更好的,更本质的代表性,从而能实现更好的分类效果。一般来说,这类方法的在性能上优于上述两类方法。但该方法对数据的需求量大,当样本数据较少时,训练出来的分类器仍存在分类偏倚问题,且模型训练周期更长,训练出的模型可解释性差,同时,对GPU的要求较高。
上述几类方法在一定程度上成功抑制了谣言泛滥的问题,但是现有方法仍然存在以下几点不足:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110903231.3/2.html,转载请声明来源钻瓜专利网。