[发明专利]一种基于微博事件关系的谣言检测方法及其系统在审
申请号: | 202011559478.X | 申请日: | 2020-12-25 |
公开(公告)号: | CN112612970A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 宋玉蓉;王昕岩 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/04;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 事件 关系 谣言 检测 方法 及其 系统 | ||
1.一种基于微博事件关系的谣言检测方法,其特征在于,包括如下步骤:
步骤S1、构建微博数据集,所述微博数据集E={e1,e2,...,en}包括n个微博事件的文本信息以及用户行为信息;
步骤S2、对每个微博事件对应的文本信息进行预处理,然后再依次输入预训练模型以及卷积神经网络模型,得到每个微博事件的特征向量,在将微博数据集中所有微博事件的特征向量组合得到特征矩阵;
步骤S3、根据所述用户行为信息构建微博事件关系图,再通过微博事件关系图得到邻接矩阵;
步骤S4、将步骤S2得到的特征矩阵以及步骤S3得到的邻接矩阵输入图卷积神经网络模型来完成模型的训练,然后得到最终的谣言检测模型;
步骤S5、将微博事件输入步骤S4得到的谣言检测模型判断是否为谣言。
2.根据权利要求1所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S2具体包括:
步骤S201、通过预处理除去微博事件ei对应的文本信息中与内容无关的停用词;
步骤S202、将经过预处理后的文本信息作为输入,输入至预训练模型中得到向量vi;
步骤S203、将向量vi输入至卷积神经网络中得到特征向量pi;
步骤S204、重复步骤S201至步骤S203,得到微博数据集中所有微博事件的特征向量,并且将所述特征向量组合成特征矩阵X∈Rn×m,n表示微博事件数,m表示特征向量的维度。
3.根据权利要求2所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S203具体包括:
步骤S2031、通过卷积层选取宽度与向量vi维度等长的卷积核,使得卷积核始终保持在竖直方向滑动,进行对向量的卷积操作,得到与卷积核数量相同的特征向量ci;
步骤S2032、再通过池化层对特征向量ci进行最大池化操作,提取局部接受域中向量的最大值,得到特征向量pi;
步骤S2033、通过全连接层对特征向量pi和分类标签进行全连接操作,得到微博事件ei的预测标签,并且保存特征向量pi作为微博事件ei的特征向量。
4.根据权利要求3所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S3具体包括:
步骤S301、提取微博数据集中的用户行为信息,包括对每个微博事件进行评论或转发的用户ID;
步骤S302、根据步骤S301得到用户ID计算第i个微博事件与第j个微博事件之间相同的评论或转发的用户数量,并将其作为这两个微博事件的联系;
步骤S303、将微博数据集中的微博事件作为节点(N),事件之间的联系作为连边(E)构建微博事件关系图G=(N,E),再通过所述微博事件关系图得到邻接矩阵A∈Rn×n;
在所述步骤S303中,根据第i个事件与第j个事件之间相同的评论者或转发者数量α,为Aij赋予不同的权重,具体是:
5.根据权利要求4所述的一种基于微博事件关系的谣言检测方法,其特征在于,在所述步骤S4中,所述图卷积神经网络模型中的第i+1个隐藏层的特征矩阵Hi+1的表达式为:
公式中,ρ表示为激活函数,Wi∈Rm×k为图卷积神经网络模型第i层的权重矩阵,其中m表示当前层输入特征的维数,k表示当前层输出特征的维数,其中为图卷积神经网络模型中标准化对称邻接矩阵,A为邻接矩阵,D∈Rn×n为度矩阵,当i=1时,其中X为图卷积神经网络模型输入的特征矩阵。
6.根据权利要求5所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述预训练模型为BERT模型或者XLNET模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011559478.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:柔性显示屏和显示装置
- 下一篇:一种基于工业互联网的智慧物流集成系统