[发明专利]一种基于人机协作的微博事件真假检测方法在审
申请号: | 202110284557.2 | 申请日: | 2021-03-17 |
公开(公告)号: | CN113064991A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 於志文;杨曼媛;杨帆;郭斌;王亮 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/95 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人机 协作 事件 真假 检测 方法 | ||
1.一种基于人机协作的微博事件真假检测方法,其特征在于,包括以下步骤:
步骤1:在微博上对数据进行采集,包括微博主体、评论、发表微博以及评论的用户信息数据,用户信息数据如表1;
表1用户数据信息
步骤2:对用户进行可信度检测;
步骤2-1:根据用户是否填写相应信息将用户的信息处理为二元属性,若填写了相应的信息,取值为1,否则取值为0,表示为:
其中f(i)表示二元处理的结果,Ui表示用户的静态信息可信度,n表示需要处理的信息数量;
步骤2-2:将微博、粉丝、关注、互关、好友情况进行数据规约和数据变换处理;
步骤2-2-1:延伸出涨粉速率Vfo以及微博活跃度Vtw两个指标,计算公式如下:
其中,fonum为粉丝数量,twnum为微博数量,Uv表示用户活跃度的可信度;
步骤2-2-2:通过分析微博用户互粉数、关注数、粉丝数,进行数据变换,延伸出互粉比例系数BiFo特征指标:
其中,Bifo(.)表示互粉比例系数,Fo(.)表示关注数量,a表示每个特征的系数,i、j分别表示用户的不同特征数值与用户某一时刻特征的数值,z表示求取最大特征数值对应的序号;Num(.)表示微博数量Tw、关注数量Fo、互粉量数Bf、好友数量Fr四个指标之一;
分别用微博数量Tw、关注数量Fo、互粉量数Bf、好友数量Fr四个指标作为Num(.)代入式(3),得到每个指标对应的判断用户可信度的特征,之后将其相加得到对用户的可信度影响因子评估如下:
步骤2-3:计算用户的可信度UC:
UC=(θ(Ui),θ(Uv),θ(Ur))
其中θ(x)为递减函数,t1表示时间,p表示时间系数;
步骤3:对微博的文本内容进行情绪分数检测;
其中,t为指数,t的值取决于是否极性反转;k代表程度词的程度,word(j)表示每个词的原始分数,ρ表示每部分积极词或消极词的频率m、n分别表示否定词与程度副词的数量;
步骤4:对微博事件进行建模,将微博事件构造成一个由用户、微博正文和评论作为节点交互的四层网络结构;具体建模过程如下:
将同样角度的微博进行聚类,构成子事件,将不同子事件的聚类中心进行连接,所构成的边用聚类中心的余弦相似度作为度量;
对子事件内部的微博,微博之间边的权值决定了两条微博之间的相互影响情况,两条微博相似度越高,他们边的权重就越大,通过杰卡德相似度对其边进行计算;
评论是用户对事件微博的外在评定,一条评论对于微博的影响程度来自于评论与微博的一致程度,使用余弦相似度作为微博与评论的边进行差异度量;
对相同用户的发言建立边的连接,使用杰卡德方法对其进行度量;
最终构成的图G=(E,V)即是以节点和边为基本数据组的拓扑结构;
步骤5:使用GCN对图模型G(N,E)进行处理;
在图G(N,E)中,节点N的输入为用户的可信度、文本的情感评估分数,边E的输入为不同实体之间的相似度度量结果;FGCN的邻接矩阵A是n维方阵,n代表图中节点数量,A中每个元素表示两个节点之间的权重;处理过程中,在GCN中加入类邻接矩阵,对同阶的邻域节点加权分配邻居权重;
步骤6:根据微博与子事件中心微博的相似度绝对值大小对微博进行提取,提出超过相似度绝对值的微博,所提取出的微博分为以下三种情况:
1、微博文本为用户本人的主观评价,用户针对事件进行了讨论,微博本身与事件相关,因此不做任何处理;
2、微博中虽然包含对事件的评价,但是其中夹杂着广告,将这种情况的微博直接删除;
3、偏移事件的主题,行文过程中转向对其它事物的评价;若超过一半的微博篇幅与评论都用来描述与主题不相干事件,对微博进行删除;若微博正文内仅仅提到了另外的事件,则将其评论中不相干的评论进行删除,保证微博的评论中只包含对相关事件的看法;
步骤7:将经过步骤6处理过的微博事件重新进行聚类,重复一次步骤4到步骤6,生产新的图模型,使用GCN对新的图模型进行处理,得到最后的检测结果。
2.根据权利要求1所述的一种基于人机协作的微博事件真假检测方法,其特征在于,所述步骤6中的相似度的绝对值大小为0.15。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110284557.2/1.html,转载请声明来源钻瓜专利网。