[发明专利]一种社交网络僵尸账号检测方法及装置有效

专利信息
申请号: 201510278739.3 申请日: 2015-05-27
公开(公告)号: CN104901847B 公开(公告)日: 2018-10-30
发明(设计)人: 刘玮;王丽宏;张同虎 申请(专利权)人: 国家计算机网络与信息安全管理中心
主分类号: H04L12/26 分类号: H04L12/26;H04L29/06;G06F17/30
代理公司: 工业和信息化部电子专利中心 11010 代理人: 罗丹
地址: 100029*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 社交 网络 僵尸 账号 检测 方法 装置
【权利要求书】:

1.一种社交网络僵尸账号检测方法,其特征在于,包括:

从僵尸账号样本集和正常账号样本集中分别提取出层次化特征,基于提取出的所述层次化特征分层次的建立各层分类器;

基于各层分类器对待预测账号进行检测,判断所述待预测账号是否属于僵尸账号;

所述层次化特征,包括以下四个层次的特征:

第一层的特征:账号资料特征;

其余三层的特征分别是:微博内容特征、发帖时间特征、发帖行为一致性特征;

所述账号资料特征,包括:

用户昵称中字符与数字的长度之和占用用户昵称总长度的比例;

是否填写了家庭住址;

账号发帖数;

账号粉丝数;

账号关注数;

账号关注数与粉丝数的比例;

所述微博内容特征,包括:

账号所发微博中含有统一资源定位器URL的微博的比例;

账号所发微博中所含URL去重后的数量与账号所发微博中所有URL数量的比值;

账号所发微博中所含内容关键词去重后的数量与账号所发微博中所有关键词数量的比值;

所述发帖时间特征,包括:

最后一次发帖与第一次发帖的时间跨度;

发帖时间分布情况;

所述发帖行为一致性特征,包括:

基于发帖时间间隔,构建发帖时间间隔序列,按照如下公式计算发帖时间间隔序列的波动性s:

其中,xi表示第i个帖子和第i-1个帖子之间的发帖时间间隔,i为变量,以秒为单位,n-1是所有帖子数减一,表示发帖时间间隔平均值。

2.根据权利要求1所述的社交网络僵尸账号检测方法,其特征在于,所述基于提取出的所述层次化特征分层次的建立各层分类器,包括:

步骤A1,在账号资料特征的基础上利用分类模型算法建立第一层分类器;

步骤A2,在微博内容特征、发帖时间特征、发帖行为一致性特征中任选其一、以及账号资料特征的基础上利用分类模型算法建立第二层分类器;

步骤A3,在剩余的两项层次化特征之一、以及步骤A1~A2中已经使用的层次化特征的基础上利用分类模型算法建立第三层分类器;

步骤A4,在最后一项层次化特征、以及步骤A1~A3中已经使用的层次化特征的基础上利用分类模型算法建立第四层分类器。

3.根据权利要求2所述的社交网络僵尸账号检测方法,其特征在于,所述分类模型算法,包括:C4.5决策树算法、支持向量机SVM算法或者贝叶斯分类算法。

4.根据权利要求2所述的社交网络僵尸账号检测方法,其特征在于,在第一层~第四层分类器分别对应于:账号资料特征;账号资料特征和微博内容特征;账号资料特征、微博内容特征和发帖时间特征;账号资料特征、微博内容特征、发帖时间特征和发帖行为一致性特征的情况下:

所述基于各层分类器对待预测账号进行检测,判断所述待预测账号是否属于僵尸账号,包括:

步骤B1,将待预测账号的账号资料特征输入第一层分类器进行处理,如果分类结果为僵尸账号,则流程结束,如果分类结果为正常账号,则执行步骤B2;

步骤B2,将待预测账号的微博内容特征、连同该待预测账号的账号资料特征一起,输入第二层分类器进行处理,如果分类结果为僵尸账号,则流程结束,如果分类结果为正常账号,则执行步骤B3;

步骤B3,将待预测账号的发帖时间特征、连同该待预测账号的账号资料特征和微博内容特征一起,输入第三层分类器进行处理,如果分类结果为僵尸账号,则流程结束,如果分类结果为正常账号,则执行步骤B4;

步骤B4,将待预测账号的发帖行为一致性特征、连同该待预测账号的账号资料特征、微博内容特征和发帖时间特征一起,输入第四层分类器进行处理,如果分类结果为僵尸账号,则流程结束,如果分类结果为正常账号,则判定为正常账号,流程结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510278739.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top