[发明专利]一种网络谣言识别方法及系统有效
申请号: | 202011099869.8 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112231562B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 段大高;白宸宇;韩忠明;刘文文;张翙 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G06N3/0464;G06N3/048;G06N3/084;G06Q50/00 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 张梦泽 |
地址: | 100089*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 谣言 识别 方法 系统 | ||
1.一种网络谣言识别方法,其特征在于,包括:
根据包含谣言信息的多个文本得到文本特征矩阵;
构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;
构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;
根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;
根据所述谣言识别模型识别网络谣言;
其中,所述根据包含谣言信息的多个文本得到文本特征矩阵,具体为:
训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;
根据所述词向量获取多个所述文本的第一词特征矩阵;
将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;具体包括:将所述第一词特征矩阵通过相同的h组多头注意力机制进行学习,得到h组更新后的第一词特征矩阵;h为大于1的正整数;将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩阵;
将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。
2.根据权利要求1所述的网络谣言识别方法,其特征在于,还包括:
对多个所述文本进行清洗和长度规范化。
3.根据权利要求1所述的网络谣言识别方法,其特征在于,所述训练包含谣言信息的多个文本中的单词,得到所述单词的词向量,具体为:
根据Word2Vec中的Skip-Gram神经网络模型训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;其中所述Skip-Gram神经网络模型使用的窗口大小为5,所述词向量的嵌入维度为300。
4.根据权利要求1所述的网络谣言识别方法,其特征在于,所述将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵,具体为:
将所述第二词特征矩阵输入卷积层,得到卷积层特征;
将所述卷积层特征输入最大池化层,得到所述文本特征矩阵。
5.根据权利要求1所述的网络谣言识别方法,其特征在于,所述根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型,具体为:
将所述谣言特征矩阵输入平均池化层、全连接层以及Softmax层得到谣言预测类别;
根据所述谣言预测类别和真实谣言类别反向训练所述神经网络模型,得到谣言识别模型。
6.根据权利要求5所述的网络谣言识别方法,其特征在于,所述根据所述谣言预测类别和真实谣言类别反向训练所述神经网络模型,得到谣言识别模型,具体为:
获取所述谣言预测类别与所述真实谣言类别之间的差值;
判断所述差值是否在预设阈值范围内;
若是,则确定所述神经网络模型为所述谣言识别模型;
若否,则根据所述差值反向训练所述神经网络模型,使所述差值在所述预设阈值范围内。
7.一种网络谣言识别系统,其特征在于,包括:
文本特征矩阵获取模块,用于根据包含谣言信息的多个文本得到文本特征矩阵;
第一构建模块,用于构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;
第二构建模块,用于构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;
训练模块,用于根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;
识别模块,用于根据所述谣言识别模型识别网络谣言;
所述文本特征矩阵获取模块包括:
训练单元,用于训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;
获取单元,用于根据所述词向量获取多个所述文本的第一词特征矩阵;
学习单元,用于将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;具体包括:将所述第一词特征矩阵通过相同的h组多头注意力机制进行学习,得到h组更新后的第一词特征矩阵;h为大于1的正整数;将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩阵;
输入单元,用于将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011099869.8/1.html,转载请声明来源钻瓜专利网。