[发明专利]一种检测网络水军以及找到网络水军的方法有效
申请号: | 201110418586.X | 申请日: | 2011-12-14 |
公开(公告)号: | CN102571484A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 周异;申沛;陈凯;宋利;杨小康 | 申请(专利权)人: | 上海交通大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 网络 水军 以及 找到 方法 | ||
技术领域
本发明涉及一种社交网络,具体地说,涉及的是一种检测网络水军以及找到网络水军的方法。
背景技术
如今社会,网络已经成为人们信息传播和资源共享的重要途径,对社会的生产活动产生了很大的影响。人们通过网络获取信息的方式更为快捷、经济和开放,大大方便了人们日常工作和生活,节约了成本。同时,网络也已经发展为一种虚拟的社会形态。
社交网络,主要类似微博,是一个基于用户关系的信息分享、传播以及获取的平台。在科技发达的今天,人们可以随时随地的看微博,发微博,获取最新的信息。但是信息的真实性,却并不像想象中那么高。
水军,是指在网络中大量灌水的人员。在楼主发微博之后,为了获得最广大网名的注意,就需要大量的人员来回复或者转发其微博。而这个工作常常需要成百上千的人来共同完成,于是经常会利用水军来完成这个任务。一旦大规模的水军在网络中发帖造势,很容易控制舆论导向,使得虚假信息到处传播,危害社会稳定。
发明内容
本发明要解决的问题是提供一种检测网络中存在的水军的方法,并基于此,找出这些水军,以便于发现并控制虚假信息的传播,从而可以尽量维护网络社会的真实和稳定性。
本发明一个目的是提供一种检测网络水军的方法,具体包括:
第一步,帐号特征模块对帐号特征向量进行描述,这个向量包括多维;
第二步,帐号检测模块对收集的帐号,根据帐号特征向量符合机器人帐号特性的多少来检测网络水军。
上述步骤中,用R表示机器人特征显著性,帐号的特征描述向量有多个维度,第i个维度有一个权值a[i],被判断满足该维度条件的帐号会获得a[i]的权值加成,即R=R+a[i],当最终权值R>Rmax,则该帐号为机器人帐号。a[i]与Rmax的值将在下面给出。
进一步的,所述帐号特征模块,其中帐号特征描述向量维度包括:
向量维度1:帐号的关注人数是否异常;
向量维度2:关注人数与粉丝数的比值是否异常;
向量维度3:帐号所发原创微博的文字内容是否为抄袭所得;
向量维度4:帐号所发图片内容是否为抄袭所得;
向量维度5:帐号转发微博是否不带评论;
向量维度6:帐号是否发广告和垃圾信息;
向量维度7:帐号所发评论是否为抄袭;
向量维度8:帐号发帖内容的是否相似度高;
向量维度9:帐号发帖频率是否异常。
向量维度10:帐号发帖间隔是否异常。
进一步的,所述帐号检测模块检测网络水军,具体流程如下:
1)向量维度1:帐号的关注人数异常。如果关注人数Nforward>FMAX,FMAX=300。则判断满足机器人特征,R=R+a[1],a[1]=5;
2)向量维度2:关注人数与粉丝数的比值异常。如果关注人数与粉丝数的比值K>Kmax=5,或者K<Kmin=0.2。则判断满足机器人特征,R=R+a[2],a[2]=3;
3)向量维度3:帐号所发原创微博的文字内容为抄袭所得。从帐号微博中选一句话出来进行搜索,把所有搜索出来的原创微博进行一种聚类。每一类中微博发布时间Wtime最小的微博可以认为是原创微博,而对于其余微博,如果相似度L>Lmax,则认为是抄袭微博。获得除本帐号以外所有被认为抄袭了微博的帐号ID,转到1)步。Lmax=90%。如果该帐号微博相似度L>Lmax,,则判断满足机器人特征,R=R+a[3],a[3]=4;
4)向量维度4:帐号所发图片内容为抄袭所得。通过图像处理技术判断图片中如果否有他人logo或者相互重叠的logo,则判断满足机器人特征,R=R+a[4],a[4]=4;
5)向量维度5:帐号转发微博不带评论。不加评论的概率超过P>Pmax=95%,则判断满足机器人特征,R=R+a[5],a[5]=2;
6)向量维度6:帐号发广告和垃圾信息。可以通过语义识别判断出帐号的评论是否为广告。对于有链接的回复可以获取其网址,打开网址。通过一定方法判断该回复是不是在为这个网站打广告。如果判断成功,则判断满足机器人特征,R=R+a[6],a[6]=10;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110418586.X/2.html,转载请声明来源钻瓜专利网。