[发明专利]一种在微博平台中捕获水军的方法有效

专利信息
申请号: 201310017802.9 申请日: 2013-01-17
公开(公告)号: CN103095499A 公开(公告)日: 2013-05-08
发明(设计)人: 陈凯;周曲;周异;林成峰 申请(专利权)人: 上海交通大学
主分类号: H04L12/24 分类号: H04L12/24;H04L12/26
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 平台 捕获 水军 方法
【说明书】:

技术领域

本发明涉及互联网技术领域的社交网络水军捕获方法,具体地,涉及一种在微博平台中捕获水军的方法。

背景技术

随着互联网技术的发展,社交网络的发展如火如荼,逐渐成为网民日常生活中的重要部分。社交网络带来了全新的低成本宣传平台,于是,一种被称为“水军”的用户出现了,他们通过发布特定主题的信息,达到宣传、控制舆论等目的。如何在海量的社交网络用户中检测并且捕捉到这些水军成为了维护社交网络服务质量的一个关键问题。

在众多类型的社交网络中,微博由于其单向关注、内容简洁、高实时性和多终端移动性的特点成异军突起。因此在微博平台上水军现象尤为严重。这也使得微博平台上的反水军机制成为了一个难题。

经检索,申请号为201110418586.X、公开号为102571484A的中国发明专利,该发明公开了一种检测网络水军以及找到网络水军的方法,首先建立蜜罐帐号;通过帐号管理模块对所有蜜罐帐号进行统一筹划,确定蜜罐帐号的发帖和关注策略;从收集的帐号中检测机器人帐号;帐号特征模块对帐号特征向量进行描述,这个向量包括多维;帐号检测模块对收集的帐号,根据帐号特征向量符合机器人帐号特性的多少来检测网络水军;利用检测出来的机器人帐号找到更多的机器人帐号和水军。相比较,本发明不是通过设立蜜罐账号来吸引水军,而是通过搜集信息然后过滤的方法来找到水军,更加的主动、快速、有效。

检索中还发现,申请号为201210050176.9、公开号为102629904A的中国发明专利,该发明公开了一种网络水军的探测与判定方法,包括用户行为采集,用户行为统计和网络水军分类器训练三个模块,其流程为:用户行为采集——用户行为统计——网络水军预测——网络水军判定。该发明通过获取用户行为样本后对用户行为进行统计,再使用机器学习的方法建立预测模型,最后对网络水军进行预测。相比较,本发明不需要建立机器学习模型,更加简单和快速。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种在微博平台中捕获水军的方法。根据少量的初始水军样本,通过分析他们的社会关系网,在尽可能减少人工判断干预的情况下捕获其他的水军。

为实现上述的目的,本发明包括如下步骤:

第一步,通过新微博热门话题或者名人微博的转发列表等途径,获取嫌疑用户。选取三个特征值的阈值(参与率的阈值Ma、平均重复度的阈值Mb、转发重复度峰值的阈值Mr),然后利用反复的过滤—抽样验证的方法调整并确定阈值。利用该阈值过滤嫌疑用户,并且通过人工观察用户是否具有水军的行为特征(例如反复转发同一条微博等),获得初始水军样本S;Ma、Mb、Mr含义分别为:对于确定的微博列表,单个用户参与转发的微博数量占总微博数量的比例,即参与率阈值Ma;用户的总转发次数和用户参与的微博数量的比例(即用户对单条微博的平均转发次数),即平均重复度阈值Mb;用户重复转发单条微博的次数的最大值,即转发重复度峰值阈值Mr

第二步,获取所有样本水军的粉丝列表L,按照预先设定的密切度阈值Mc(即在水军样本中关注的用户数量或者数量占总数的比例)过滤得到和样本中多个水军关系密切的用户列表L’。

第三步,获取这些用户的微博发布特征信息,包括用户的所有微博中转发的微博的数量Cr和用户转发的源微博Cs的数量。

第四步,利用第三步获得的信息,计算用户的平均重复特征值(平均每条微博重复转发的次数)和重复转发次数的峰值。然后利用第一步设定的平均重复度的阈值Mb和转发重复度峰值的阈值Mr进行过滤,将两个特征值都超过阈值的用户判定为水军。

第五步,将新得到的水军加入到样本中,之后可以选择重复步骤二到步骤四的迭代过程。

上述第一步获取初始水军样本具体流程如下:

1)选定特定热门话题(或者某个微博名人),获取相关微博列表(对微博名人来说就是他的微博列表)。

2)抓取这些微博的转发列表,统计其中涉及的用户和每个用户的转发次数等信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310017802.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top