[发明专利]一种网络谣言识别方法及系统有效
申请号: | 202011099869.8 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112231562B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 段大高;白宸宇;韩忠明;刘文文;张翙 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G06N3/0464;G06N3/048;G06N3/084;G06Q50/00 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 张梦泽 |
地址: | 100089*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 谣言 识别 方法 系统 | ||
本发明涉及一种网络谣言识别方法即系统,方法包括:根据包含谣言信息的多个文本得到文本特征矩阵;构建传播图结构,图结构中的节点为多个文本,图结构中的邻接矩阵为谣言信息在多个文本之间的转发和评论关系;构建图卷积神经网络模型;图卷积神经网络模型的输入为文本特征矩阵和邻接矩阵,图卷积神经网络模型的输出为谣言特征矩阵;根据谣言特征矩阵训练神经网络模型,得到谣言识别模型;根据谣言识别模型识别网络谣言。本发明根据谣言在多个文本之间的转发和评论关系训练图卷积神经网络模型,根据谣言特征矩阵训练神经网络模型,有效的捕获了谣言信息广泛且分散的传播特征,可以有效识别谣言信息。
技术领域
本发明涉及网络谣言识别技术领域,特别是涉及一种网络谣言识别方法及系统。
背景技术
大数据环境下,在线社会网络与人们的生活、娱乐以及工作逐渐融为一体。社交媒体已经成为人们分享信息以及交流的平台,其信息繁杂,传播自由便捷,影响力大等特点,使其成为舆情爆发和升温的重要传播媒介。由于缺乏有效监管,谣言等虚假信息的泛滥会给政治、经济、文化等领域带来很大的威胁和影响,已成为在线社会网络诸多应用发展面临的主要瓶颈之一。社交媒体谣言识别任务引起自然语言处理、数据挖掘等领域研究者的强烈关注,它能够用于辅助预警、预防、监控、治理等谣言清除工作,因此社交媒体谣言识别是改善在线社会网络信息生态环境质量、提升用户体验的有效手段。
目前有很多方法检测谣言。传统方法主要从人工定义特征的角度出发,主要通过构建相关谣言微博的特征,使用决策树或支持向量机等机器学习分类器进行事件分类,通用性较差。这种基于特征工程的方法虽然取得了一定的成效,但是需要耗费大量资源,并且受限于人工设计的规则。当今,随着深度学习的快速发展,基于深度神经网络模型在语义表示与谣言检测运用方面更具优势。
神经网络模型与机器学习方法相比,能够自动从数据中学习事件特征,避免了大量的特征工程,在捕获上下文之间复杂的语义关系方面也有更好的拓展性。但目前神经网络谣言检测模型,大多在于学习更好的事件特征或语义信息,而现实生活中社交媒体的信息传播具有结构关系,因此神经网络模型检测谣言并不理想。
发明内容
本发明的目的是提供一种网络谣言识别方法及系统,以有效识别网络中传播的谣言信息。
为实现上述目的,本发明提供了如下方案:
一种网络谣言识别方法,包括:
根据包含谣言信息的多个文本得到文本特征矩阵;
构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;
构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;
根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;
根据所述谣言识别模型识别网络谣言。
可选地,所述根据包含谣言信息的多个文本得到文本特征矩阵,具体为:
训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;
根据所述词向量获取多个所述文本的第一词特征矩阵;
将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;
将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。
可选地,还包括:
对多个所述文本进行清洗和长度规范化。
可选地,所述训练包含谣言信息的多个文本中的单词,得到所述单词的词向量,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011099869.8/2.html,转载请声明来源钻瓜专利网。