[发明专利]基于图神经网络特征聚合的谣言检测方法及装置有效
申请号: | 202110402464.5 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113139052B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 马凯;刘小迪;徐守志;马圆圆;向舜陟 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨云云 |
地址: | 443002 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 特征 聚合 谣言 检测 方法 装置 | ||
1.一种基于图神经网络特征聚合的谣言检测方法,其特征在于,包括:
获取第一事件源文本图;
将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至所述图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将所述事件源文本进行图结构建模得到的;
所述训练标签是通过采用预设编码方式对所述事件源文本和所述响应推文进行标注后得到的;
所述获取第一事件源文本图,包括
对事件源推文预处理,并对预处理后的事件源推文进行图结构建模,以获取第二事件源推文图;
将所述第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量;
根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图;
其中,所述事件源推文包括所述事件源文本和所述响应推文。
2.根据权利要求1所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述对事件源推文预处理,包括:
去除所述事件源文本中的乱码数据和空行数据;以及
去除所述事件源的响应推文的冗余项;
其中,所述冗余项包括转发但未评论的事件源的响应推文、乱码数据和空行数据。
3.根据权利要求1所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述事件源文本的词向量通过如下方式获取:
去除所述事件源文本中的乱码数据和空行数据,获取满足预设条件的事件源文本;
对满足所述预设条件的事件源文本分词预处理,并将分词预处理后的满足所述预设条件的事件源文本输入至训练好的BERT模型,以获取所述事件源文本的词向量;
其中,所述分词预处理包括分词处理和去停用词处理。
4.根据权利要求3所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图,包括:
获取所述文本级特征向量中表示所述事件源推文的向量;
获取所述事件源文本的词向量表示的词语;
将所述词语与预处理后的事件源文本进行对应,确定所述词语所属事件;
根据所述词语所属事件,确定所述词语与所述事件源推文的向量之间的映射字典;
根据所述事件源文本的词向量和所述映射字典,确定所述事件源推文的聚合特征向量;
通过将所述聚合特征向量作为所述第一事件源文本图的节点集以及将所述词语之间的共现关系作为所述第一事件源文本图的边集,以获取所述第一事件源文本图。
5.根据权利要求1所述的基于图神经网络特征聚合的谣言检测方法,其特征在于,所述训练好的第二图神经网络模型通过如下方式获取:
将所述第二事件源推文图和所述训练标签输入至预设第二图神经网络模型进行训练,根据预设第一更新规则和预设第一激活函数对所述第二事件源推文图中的每个节点进行第一次更新;
根据第一次更新后的节点、预设分层传播规则和预设嵌入矩阵向量,确定所述事件源推文的文本级特征向量;
根据所述文本级特征向量,获取所述预设第二图神经网络模型的第一交叉熵函数,并在所述第一交叉熵函数小于第一预设阈值时,停止训练,以获取所述训练好的第二图神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110402464.5/1.html,转载请声明来源钻瓜专利网。