[发明专利]基于分层异质图神经网络的社交媒体谣言检测方法及系统有效
申请号: | 202110775965.8 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113515634B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 廖祥文;王灿杰;林建洲;林树凯;陈泓敏 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/216;G06N3/047 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈鼎桂;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分层 异质图 神经网络 社交 媒体 谣言 检测 方法 系统 | ||
本发明涉及一种基于分层异质图神经网络的社交媒体谣言检测方法及系统,包括基于数据预处理模块,用于对文本数据进行预处理,抽取用户静态特征,构建分层异质图结构;事件编码模块,用于编码含有传播及扩散结构信息的文本;用户编码模块,用于学习用户行为特征;全局异质图编码模块,用于捕捉事件和用户之间丰富的全局结构信息;谣言检测标签输出模块,用于融合文本信息、用户行为特征、全局异质图信息,完成谣言检测的标签预测工作。本发明能够有效的学习用户与用户之间和文本与文本之间的局部内联关系,生成含有临近节点信息的用户、文本表示,以此建模学习用户与事件之间的全局结构关系,最终识别出事件的真实性。
技术领域
本发明涉及文本检测领域,具体涉及一种基于分层异质图神经网络的社交媒体谣言检测方法及系统。
背景技术
谣言(Rumor),一般指的是在发布时真实性尚未得到证实的流传陈述或报道。这一未经核实的陈述有可能会被证实是真实的,或者部分乃至完全是虚假的,甚至其真实性也可能长期无法得到证实。随着推特、微博等社交媒体平台的迅速发展,其已逐渐取代传统媒体,成为用户获取信息、表达意见和相互交流的一个方便的在线平台。由于社交媒体具有高速传播信息的本质特性,给用户带来快捷获取新信息途径的同时,也为谣言的传播提供了温床。社交媒体与传统媒体相比,传统媒体中的信息由公认组织发布,并经过多次审查核实,但社交媒体中的大部分信息由个人发布,在传播之前并未经过真实性验证。信息发布者中的造谣者往往为了名气或其他利益,肆意编造及传播未经核实的信息,这可能会使谣言借助社交媒体强大的传播能力在短时间内接触到成百上千的人,引起社会恐慌和经济动荡。尽管如Snopes、微博社区管理中心等组织致力于揭穿在社交媒体上出现的谣言,但这些组织对信息的判断基于人工收集和评估,面对社交媒体上庞大的信息流,不仅不能全面地验证信息真实性,且通常需要较长的响应时间。因此能够快速且准确地识别社交媒体谣言对于科技、经济、以及社会稳定和发展具有非常重要的意义和价值。
近些年的社交媒体谣言检测研究工作大体上可以分为以下两类1)基于传统机器学习的谣言检测,研究精力主要集中在事件的特征选择和设计上,通过人工选择的方式从事件信息中抽取显著的特征集,包括用户特征,上下文特征,传播特征等,例如用户个人信息,文本情感极性,传播树特征。在此类特征工程的基础上使用支持向量机、决策树等分类器进行分类,判断事件是否是谣言。该类方法取得了良好的效果,但是人工提取特征使得分类结果的优劣极大地依赖于研究者精心选择和设计的关键特征的质量,因此需要消耗大量的时间和人力物力。2)基于特征表示学习的谣言检测,该类方法主要借助神经网络模型的优秀的表示学习能力,从待检测对象的各类信息中挖掘谣言与非谣言之间的区别。现有的研究主要围绕谣言的内容、发布用户以及传播模式三个关键要素展开,尤其是以对文本内容建模为主,挖掘其中不确定性的表达作为识别谣言的重要线索,但对于社交媒体,其具有的文本信息一般较短、表达不规范等典型特点,使得模型难以对事件做到有效建模。另外,现有的研究将上述三个关键要素看做是相互独立的事件表示元素,忽视了其之间相互联系、相互补充、相互增强的关系,即割裂了“用户-事件”,“用户-用户”之间密切相关的联系,导致谣言检测模型性能受限,因此无法准确地刻画谣言事件。基于此,针对事件中三个关键要素之间的关系,选择合适的算法进行表示学习,获取其潜在的特征表示,对于谣言检测具有重要的意义和价值。
发明内容
有鉴于此,本发明的目的在于提供一种基于分层异质图神经网络的社交媒体谣言检测方法及系统,能够有效的学习用户与用户之间和文本与文本之间的局部内联关系,生成含有临近节点信息的用户、文本表示,以此建模学习用户与事件之间的全局结构关系,最终识别出事件的真实性。
为实现上述目的,本发明采用如下技术方案:
一种基于分层异质图神经网络的社交媒体谣言检测方法,包括以下步骤:
步骤S1:对推文事件数据进行预处理,抽取用户静态特征,构建用户行为关系图和分层异质图结构;
步骤S2:基于预处理后推文事件数据,采用双层GCN模型,获取推文事件隐层特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110775965.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可变杆长的等曲率柔性机械臂
- 下一篇:一种石材保温板原料混料设备