[发明专利]基于传播森林的虚假信息检测方法、装置及设备在审

专利信息
申请号: 202211739135.0 申请日: 2022-12-30
公开(公告)号: CN116226545A 公开(公告)日: 2023-06-06
发明(设计)人: 周薇;卫玲蔚;胡斗;赖彦彤;虎嵩林 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G06F16/9536 分类号: G06F16/9536;G06F16/9535;G06F16/9538
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 陈艳
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 传播 森林 虚假 信息 检测 方法 装置 设备
【说明书】:

发明公开了一种基于传播森林的虚假信息检测方法、装置及设备,所述方法包括:针对待检测的源博文集合,获取每一源博文在社交网络中博文的传播数据,传播数据包括:传播内容和传播关系;提取传播内容的文本特征;将源博文集合根据文本特征划分为K个类簇后,计算传播原型并构建传播树;基于传播原型和传播树,构建传播森林;聚合传播森林中的节点邻域表示,以得到节点的嵌入表示;针对源博文节点与后续传播博文节点,分别根据相应的文本特征和嵌入表示,计算增强嵌入表示;对源博文节点与后续传播博文节点的增强嵌入表示应用检测模型进行分类,得到源博文集合中各源博文的虚假检测结果。本发明可以提高虚假信息检测任务的性能。

技术领域

本发明涉及数据挖掘技术领域,具体涉及一种基于传播森林的虚假信息检测方法、装置及设备。

背景技术

近年来,得益于社交媒体的便利性,滋生了大量的虚假信息。这些虚假信息呈现多线程传播模式,为网络生态带来了巨大的危害和负面影响,严重影响了社会安定和人们日常生活。因此,如何及时准确地检测出虚假信息是社交网络分析领域中一个迫切需要的研究课题,有重要的研究意义和现实应用意义。

大多数虚假信息发布都是围绕一个特定的热点话题或舆论事件,故在语义层面,不同的虚假信息之间存在潜在的语义关联。此外,许多虚假信息在实际传播中,背后都是由庞大的恶意组织所牵引,这使得大多数虚假信息的传播模式是相似的。因此,如何巧妙地利用多条虚假信息传播线相似的语义关联与传播模式,对于实现更准确的虚假信息检测具有积极作用。

现有的检测方法仅仅关注于单个信息传播的深度建模,忽略了不同信息传播背后共享的传播模式;或仅关注细粒度(如单词级别)的语义关联,由于单词在不同上下文语境下呈现不同的含义,这样的做法会引入噪声语义信息,甚至限制现有虚假信息检测方法的性能。

发明内容

本发明针对主要的技术问题是如何利用多条虚假信息传播线相似的语义关联与传播模式。本发明提供一种基于传播森林的虚假信息检测方法、装置及设备,以提高虚假信息检测任务的性能。

本发明的具体技术方案如下:

根据本公开实施例的第一方面,本发明提供的技术方案提供一种基于传播森林的虚假信息检测方法,所述方法包括以下步骤:

针对待检测的源博文集合,获取每一源博文在社交网络中博文的传播数据;其中,所述传播数据包括:传播内容和传播关系;

提取所述传播内容的文本特征;

将所述源博文集合根据文本特征划分为K个类簇后,将每一类簇的中心向量作为传播原型,并基于每一类簇对应的所述文本特征和所述传播关系,构建该类簇传播树;

基于所述传播原型和所述传播树,构建传播森林;其中,所述传播森林的节点包括:源博文节点、传播原型节点和所述传播树中的后续传播博文节点,所述传播森林的边包括:基于所述类簇的伪标签定义所述源博文节点和所述传播原型节点间的连接、所述源博文节点和后续传播博文节点间的连接和所述后续传播博文节点间对应的连接,所述源博文节点和所述后续传播博文节点的初始表示为文本特征,所述传播原型节点的初始表示为所述类簇的中心向量;

聚合所述传播森林中的节点邻域表示,以得到所述节点的嵌入表示;

针对所述源博文节点与所述后续传播博文节点,分别根据相应的文本特征和嵌入表示,计算增强嵌入表示;

对所述源博文节点与所述后续传播博文节点的增强嵌入表示应用检测模型进行分类,得到所述源博文集合中各源博文的虚假检测结果。

进一步地,所述后续传播博文节点包括转发节点和评论节点中至少一种。

进一步地,所述将所述源博文集合根据文本特征划分为K个类簇后,将每一类簇的中心向量作为传播原型,包括:

随机初始化K个向量;其中每一向量对应于一传播原型

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211739135.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top