[发明专利]基于传播森林的虚假信息检测方法、装置及设备在审
申请号: | 202211739135.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116226545A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 周薇;卫玲蔚;胡斗;赖彦彤;虎嵩林 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9535;G06F16/9538 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 传播 森林 虚假 信息 检测 方法 装置 设备 | ||
本发明公开了一种基于传播森林的虚假信息检测方法、装置及设备,所述方法包括:针对待检测的源博文集合,获取每一源博文在社交网络中博文的传播数据,传播数据包括:传播内容和传播关系;提取传播内容的文本特征;将源博文集合根据文本特征划分为K个类簇后,计算传播原型并构建传播树;基于传播原型和传播树,构建传播森林;聚合传播森林中的节点邻域表示,以得到节点的嵌入表示;针对源博文节点与后续传播博文节点,分别根据相应的文本特征和嵌入表示,计算增强嵌入表示;对源博文节点与后续传播博文节点的增强嵌入表示应用检测模型进行分类,得到源博文集合中各源博文的虚假检测结果。本发明可以提高虚假信息检测任务的性能。
技术领域
本发明涉及数据挖掘技术领域,具体涉及一种基于传播森林的虚假信息检测方法、装置及设备。
背景技术
近年来,得益于社交媒体的便利性,滋生了大量的虚假信息。这些虚假信息呈现多线程传播模式,为网络生态带来了巨大的危害和负面影响,严重影响了社会安定和人们日常生活。因此,如何及时准确地检测出虚假信息是社交网络分析领域中一个迫切需要的研究课题,有重要的研究意义和现实应用意义。
大多数虚假信息发布都是围绕一个特定的热点话题或舆论事件,故在语义层面,不同的虚假信息之间存在潜在的语义关联。此外,许多虚假信息在实际传播中,背后都是由庞大的恶意组织所牵引,这使得大多数虚假信息的传播模式是相似的。因此,如何巧妙地利用多条虚假信息传播线相似的语义关联与传播模式,对于实现更准确的虚假信息检测具有积极作用。
现有的检测方法仅仅关注于单个信息传播的深度建模,忽略了不同信息传播背后共享的传播模式;或仅关注细粒度(如单词级别)的语义关联,由于单词在不同上下文语境下呈现不同的含义,这样的做法会引入噪声语义信息,甚至限制现有虚假信息检测方法的性能。
发明内容
本发明针对主要的技术问题是如何利用多条虚假信息传播线相似的语义关联与传播模式。本发明提供一种基于传播森林的虚假信息检测方法、装置及设备,以提高虚假信息检测任务的性能。
本发明的具体技术方案如下:
根据本公开实施例的第一方面,本发明提供的技术方案提供一种基于传播森林的虚假信息检测方法,所述方法包括以下步骤:
针对待检测的源博文集合,获取每一源博文在社交网络中博文的传播数据;其中,所述传播数据包括:传播内容和传播关系;
提取所述传播内容的文本特征;
将所述源博文集合根据文本特征划分为K个类簇后,将每一类簇的中心向量作为传播原型,并基于每一类簇对应的所述文本特征和所述传播关系,构建该类簇传播树;
基于所述传播原型和所述传播树,构建传播森林;其中,所述传播森林的节点包括:源博文节点、传播原型节点和所述传播树中的后续传播博文节点,所述传播森林的边包括:基于所述类簇的伪标签定义所述源博文节点和所述传播原型节点间的连接、所述源博文节点和后续传播博文节点间的连接和所述后续传播博文节点间对应的连接,所述源博文节点和所述后续传播博文节点的初始表示为文本特征,所述传播原型节点的初始表示为所述类簇的中心向量;
聚合所述传播森林中的节点邻域表示,以得到所述节点的嵌入表示;
针对所述源博文节点与所述后续传播博文节点,分别根据相应的文本特征和嵌入表示,计算增强嵌入表示;
对所述源博文节点与所述后续传播博文节点的增强嵌入表示应用检测模型进行分类,得到所述源博文集合中各源博文的虚假检测结果。
进一步地,所述后续传播博文节点包括转发节点和评论节点中至少一种。
进一步地,所述将所述源博文集合根据文本特征划分为K个类簇后,将每一类簇的中心向量作为传播原型,包括:
随机初始化K个向量;其中每一向量对应于一传播原型
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211739135.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电解水制氧催化剂、电极片及其应用
- 下一篇:一种深孔法兰轴锻造成形方法