[发明专利]基于传播森林的虚假信息检测方法、装置及设备在审
申请号: | 202211739135.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116226545A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 周薇;卫玲蔚;胡斗;赖彦彤;虎嵩林 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9535;G06F16/9538 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 传播 森林 虚假 信息 检测 方法 装置 设备 | ||
1.一种基于传播森林的虚假信息检测方法,其特征在于,所述方法包括:
针对待检测的源博文集合,获取每一源博文在社交网络中博文的传播数据;其中,所述传播数据包括:传播内容和传播关系;
提取所述传播内容的文本特征;
将所述源博文集合根据文本特征划分为K个类簇后,将每一类簇的中心向量作为传播原型,并基于每一类簇对应的所述文本特征和所述传播关系,构建该类簇传播树;
基于所述传播原型和所述传播树,构建传播森林;其中,所述传播森林的节点包括:源博文节点、传播原型节点和所述传播树中的后续传播博文节点,所述传播森林的边包括:基于所述类簇的伪标签定义所述源博文节点和所述传播原型节点间的连接、所述源博文节点和后续传播博文节点间的连接和所述后续传播博文节点间对应的连接,所述源博文节点和所述后续传播博文节点的初始表示为文本特征,所述传播原型节点的初始表示为所述类簇的中心向量;
聚合所述传播森林中的节点邻域表示,以得到所述节点的嵌入表示;
针对所述源博文节点与所述后续传播博文节点,分别根据相应的文本特征和嵌入表示,计算增强嵌入表示;
对所述源博文节点与所述后续传播博文节点的增强嵌入表示应用检测模型进行分类,得到所述源博文集合中各源博文的虚假检测结果。
2.如权利要求1所述的方法,其特征在于,所述后续传播博文节点包括转发节点和评论节点中至少一种。
3.如权利要求1所述的方法,其特征在于,所述将所述源博文集合根据文本特征划分为K个类簇后,将每一类簇的中心向量作为传播原型,包括:
随机初始化K个向量;其中每一向量对应于一传播原型
针对所述文本特征集合中的每一文本特征,将所述文本特征分配到在语义空间中距离最近的传播原型以生成若干类簇其中,t表示迭代轮数;
根据每一类簇中的文本特征,计算该类簇的中心向量,以得到传播原型
基于所述文本特征的分布与各传播原型计算损失函数φ;
在所述损失函数φ未收敛的情况下,令t=t+1,并返回至所述针对所述文本特征集合中的每一文本特征,将所述文本特征分配到在语义空间中距离最近的传播原型以生成若干类簇
在所述损失函数φ收敛的情况下,获取所述传播原型。
4.如权利要求3所述的方法,其特征在于,所述损失函数其中,表示类簇中所述文本特征的数量,为所述类簇中的所述文本特征,β表示平滑项。
5.如权利要求1所述的方法,其特征在于,所述聚合所述传播森林中的节点邻域表示,以得到所述节点的嵌入表示,包括:
利用图卷积网络聚合传播森林中节点的邻域信息,得到节点表示
利用图卷积层将所述节点表示传递到所述传播树中,得到所述节点的嵌入表示。
6.如权利要求1所述的方法,其特征在于,所述针对所述源博文节点与所述后续传播博文节点,分别根据文本特征和嵌入表示,计算增强嵌入表示,包括:
计算所述源博文节点的增强嵌入表示其中,We表示第一可学习的参数,be表示第二可学习的参数,xi表示所述源博文节点xi对应的所述文本特征,表示所述源博文节点xi对应的所述嵌入表示;
计算所述后续传播博文节点的增强嵌入表示其中,cij表示所述后续传播博文节点cij对应的所述文本特征,所述表示所述后续传播博文节点cij对应的所述嵌入表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211739135.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电解水制氧催化剂、电极片及其应用
- 下一篇:一种深孔法兰轴锻造成形方法