[发明专利]社交僵尸网络控制节点的检测方法及装置有效
申请号: | 201410158412.8 | 申请日: | 2014-04-18 |
公开(公告)号: | CN103944901B | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 张永铮;尹涛;李书豪 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/26;G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 僵尸 网络 控制 节点 检测 方法 装置 | ||
1.一种社交僵尸网络控制节点的检测方法,其特征在于,包括:
步骤一,采集合法昵称样本和恶意昵称样本并保存,并将所述合法昵称样本的集合随机划分为第一合法昵称样本子集、第二合法昵称样本子集和第三合法昵称样本子集,将所述恶意昵称样本的集合随机划分为第一恶意昵称样本子集、第二恶意昵称样本子集,其中,所述昵称为字符串;
步骤二,基于改进的Aprior算法,从所述第一合法昵称样本子集中挖掘出所有出现频数超过设定频数阈值的各阶子字符串,将所述各阶子字符串及其出现频数按阶保存在频繁表中,其中,所述改进的Aprior算法,是指调整了生成候选表的连接规则和剪枝规则的Aprior算法,阶是指字符串的长度,出现频数是指出现次数;
步骤三,基于所述频繁表,利用所述第二合法昵称样本子集和所述第一恶意昵称样本子集,根据预设的可信度计算函数和阈值生成规则,获得可信度阈值;
步骤四,根据所述可信度计算函数,利用所述第三合法昵称样本子集和所述第二恶意昵称样本子集,验证所述可信度阈值是否有效;
步骤五,若经检验,所述可信度阈值有效,则将社交网络中节点对应的昵称作为待检测昵称,根据所述可信度计算函数计算所述待检测昵称的可信度,若所述待检测昵称的可信度小于所述可信度阈值,则所述待检测昵称为恶意昵称,与所述待检测昵称对应的节点为社交僵尸网络控制节点,否则所述待检测昵称为合法昵称。
2.根据权利要求1所述的社交僵尸网络控制节点的检测方法,其特征在于,所述步骤二中,设定频数阈值等于SIZE与MIN_SUP的乘积,其中,SIZE为所述第一合法昵称样本子集的样本规模,SIZE等于所述第一合法昵称样本子集中昵称的数量,MIN_SUP为最小相对支持度,最小相对支持度是指算法支持的某个字符串出现次数与样本数量的最小比值。
3.根据权利要求2所述的社交僵尸网络控制节点的检测方法,其特征在于,所述最小相对支持度MIN_SUP的值能够应用自适应算法进行动态调整。
4.根据权利要求1所述的社交僵尸网络控制节点的检测方法,其特征在于,所述步骤三包括:
根据预设的可信度计算函数P(X),分别计算出所述第二合法昵称样本子集和所述第一恶意昵称样本子集的可信度,其中,所述第二合法昵称样本子集的可信度为所述第二合法昵称样本子集中各个昵称的可信度的集合,所述第一恶意昵称样本子集的可信度为所述第一恶意昵称样本子集中各个昵称的可信度的集合,其中,可信度计算函数P(X)的表达式如下:
其中,X代表昵称,k代表频繁表的最大阶数,Xi代表X的第i阶子序列,Li(x)代表昵称字符串x在第i阶频繁表Li中对应的频数,若不存在,则置为0,N表示昵称X的长度;
归一化所述第二合法昵称样本子集和所述第一恶意昵称样本子集的可信度,设所述第二合法昵称样本子集为T2,所述第一恶意昵称样本子集为F1,Max(*)表示昵称样本集合*中昵称的最大可信度值,Min(*)表示昵称样本集合*中昵称的最小可信度值,表示T2和F1的可信度P(X)归一化到区间[0,1]的结果,则的表达式为:
统计生成可信度阈值,使得所述第二合法昵称样本子集中可信度小于所述可信度阈值的昵称数量与所述第一恶意昵称样本子集中可信度大于所述可信度阈值的昵称数量之差的绝对值最小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410158412.8/1.html,转载请声明来源钻瓜专利网。