[发明专利]一种基于特征聚合的社交网络谣言鉴别方法有效
申请号: | 201811634045.9 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109685153B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 王丽娜;唐奔宵;汪润;王丹磊 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 聚合 社交 网络 谣言 鉴别方法 | ||
本发明公开了一种基于特征聚合的社交网络谣言鉴别方法,通过设计深度神经网络可接受的时序传播模式特征和时间的时序文本特征,利用特征聚合技术,构造谣言检测模型,进行谣言的终期检测和早期检测。本发明解决了社交网络事件传播的传播模式特征难以作为机器学习模型输入的问题,传播模式特征不依赖于特征工程和领域知识,是实际传播过程中各类因素影响的综合体现,能有效应用于不同的谣言鉴别场景;避免因不同样本中含的消息数量巨大差异导致特征数据质量下降的缺陷,解决了传统机器学习方法中单一模型难以应对异构信息的问题,与以往谣言鉴别方法相比具有明显的准确率提升。
技术领域
本发明属于人工智能领域,尤其涉及社交网络谣言信息特征建模及检测方法。
背景技术
随着社交网络的发展,信息量急剧增长。然而,信息的质量并不能得到保障,以谣言信息为代表的虚假信息几乎渗透到了社交网络的各个角落。因此,如何实现自动化的信息可信度评估,以及预测社交媒体信息的真实性具有很高的实用意义。
未知谣言鉴别是信息可信度评估和信息内容安全的迫切要求之一,社会心理学将谣言定义为真实性未经证实或故意虚假声明的消息。谣言的传播有害于民众的生活和社会的稳定,并有可能对民众和社会造成意想不到的损失,对公共安全造成极大影响。例如2015年8月一则关于“韦拉克鲁斯附近出现吸毒团伙的枪击和孩童绑架事件”的谣言在美国社交网络中传播,其引发的骚动导致部分民众将车辆留在马路中间,冲向学校去接自己的孩子,从而造成了26起车祸。
现有的自动化谣言鉴别方法是将鉴别过程视为一个有监督的二分类学习任务。传统的基于统计学习的方法对特征工程依赖性极大,数据驱动的特征选择方法和基于领域知识的人工提取特征方法都非常耗时,并且存在难以避免的偏差,难以适应复杂多变的现代社交网络场景。另一方面,深度学习方法在网络空间安全中起到了重要作用,然而近年来出现的基于深度神经网络的端到端的学习方法面向数据特征单一,不能有效地将文本之外的内容丰富而易于获取的特征信息加以利用,一定程度上限制了模型的效果。因此,弥补现有两大类谣言鉴别方法的缺陷,发明既不依赖特征工程,也能聚合多类不同形式的特征信息加以充分利用的模型构建方法,具有非常重要的应用价值。
基于传统机器学习的社交网络谣言检测方法基本分为特征提取和模型训练两个步骤,其中特征的优劣直接影响了检测的效果。特征提取是一个利用统计等方式获取样本分布特性的过程,不同场景下的敏感特征类型存在差异,因此传统机器学习方法对于特征工程的依赖极大,不适合复杂多变的社交网络。其次,传统方法的特征提取过程同样需要丰富的领域知识,包括谣言的属性,当前网络环境结构等,但由于存在人为的干扰,不可避免的造成偏差。
传播模式是信息在社交网络的传播过程中反映在扩散速度、影响范围上的信息,传播模式受到了信息内容、社会环境、政治背景等多方面因素的影响,是各种内外界因素的共同作用的最终体现。利用传播模式特征能够避免人工特征提取的耗时,不精确等缺陷。
端到端模型是基于深度神经网络构建的学习模型,深度神经网络能够根据输入样本的分布特性,自动化的提取中间特征,因此进一步减少了人工干预造成的不利影响。此外,深度神经网络对于具有时序性的输入敏感度更高。然而,不同类型深度神经网络具有对应敏感的数据类型,例如,卷积神经网络(CNN)适合处理矩阵结构的输入,循环神经网络(RNN)更适合处理时序类型输入。
特征聚合是针对上述问题的一种有效方案,根据不同类型的特征分别构建对应子模型,并聚合各子模型的中间特征进行结果预测。特征聚合方案能够将具有独立且丰富知识的异构特征进行融合,进而克服模型受单一特征主导的问题,提高模型的预测能力。
发明内容
本发明针对现有技术的不足,提供一种社交网络中自动化谣言鉴别方法。
本发明的技术方案为一种基于特征聚合的社交网络谣言鉴别方法,包含以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811634045.9/2.html,转载请声明来源钻瓜专利网。