[发明专利]基于免疫危险理论的社交网络水军检测方法有效
申请号: | 201811460190.X | 申请日: | 2018-11-30 |
公开(公告)号: | CN110008975B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 王渔樵;李涛;肖智婕;常远 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06F18/25 | 分类号: | G06F18/25 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 李丹 |
地址: | 430081 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 免疫 危险 理论 社交 网络 水军 检测 方法 | ||
1.一种基于免疫危险理论的社交网络水军检测方法,其特征在于,包括以下步骤:
1)采集社交用户信息,所述社交用户信息包括:包括用户名、用户的注册时间在内的用户信息、用户参与舆论事件的情况、用户的关注与被关注情况、用户的微博总数;
所述用户参与舆论事件的情况包括:参与过的话题数、参与过所有话题的总次数、是否参与过第i个话题、参与第i个话题的次数;
2)识别信号获取,根据采集的社交用户信息提取社交网络水军的识别信号,包括:事件参与度信号TPtopic、关系紧密度信号Rtightness、二阶关联性信号R″和引导工具使用率信号Tguide;
2.1)事件参与度信号TPtppic的公式如下:
其中,t(i,j)表示用户j参与话题i的次数,Topic(j)表示用户参与过的话题的总次数,p(i,j)表示用户j参与事件i的0/1矩阵,参与过为1,未参与为0;
2.2)二阶关联性
用无向图G=(V,E)表示当前用户节点n所有的二阶关注关系,假设n的度为k,则G的邻接矩阵为当前用户节点n的二阶关联性R(n)″的实质用G的邻接矩阵的稠密性来表示,具体如下:
a(i,),a(,j)={nfollower∩nfollow}={x(1),x(2),…,x(k)}
其中,nfollower为节点n的被关注关系,nfollow为节点n的关注关系;
2.3)关系紧密度信号Rtightness的公式如下:
其中,FOLLOW_SUM为当前用户所有的关注数,MUTUAL_FOLLOWER为与当前用户互粉的用户数量;用表示全部n个用户的关注-粉丝矩阵,其中,为用户j的关注向量,表示用户j的粉丝向量;
2.4)引导工具使用率信号Tguide
其中,HAS_TOPIC_SUM表示用户使用“#”的总微博数,HAS_URL_SUM表示使用url的总微博数,而WEIBO_SUM表示用户的微博总数;
3)对各个信号进行融合,得到基于免疫危险理论的社交网络水军检测概率模型,用抗原成熟度MCAV表示,
其中,CS=wT·x+b
向量x用于表示社交网络水军的4个识别信号,wT为社交网络水军的识别信号对应的权重矩阵,b为偏差。
2.根据权利要求1所述的基于免疫危险理论的社交网络水军检测方法,其特征在于,所述步骤3)中社交网络水军的识别信号对应的权重矩阵wT,采用以下方式获得:
3.1)我们将每一个样本的MCAV与向量x最后一位相减求L2范数,并对所有样本求和,即得到了这一代权重矩阵的适应度:
3.2)将搜索分布下的期望适应度记为其中,θ表示密度π(z|θ)的参数,f(z)表示样本z的适应度函数;
3.3)通过对数似然法,推算出接着,设样本数为λ,从z1到zλ的样本中得到搜索梯度的估计:
设η为学习速率,则参数搜索分布的更新即:
3.4)按上述步骤,将搜索梯度算法作为黑盒来优化权重,并获得最终的社交网络水军的识别信号对应的权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811460190.X/1.html,转载请声明来源钻瓜专利网。