[发明专利]一种比特数据特征挖掘方法、系统、设备及可读介质有效

专利信息
申请号: 201910789662.4 申请日: 2019-08-26
公开(公告)号: CN112104518B 公开(公告)日: 2021-06-08
发明(设计)人: 李雪;姚秀娟;王春梅;闫毅;高翔;范亚楠 申请(专利权)人: 中国科学院国家空间科学中心
主分类号: H04L12/26 分类号: H04L12/26;H04L29/06;G06K9/62
代理公司: 北京方安思达知识产权代理有限公司 11472 代理人: 陈琳琳;李彪
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 比特 数据 特征 挖掘 方法 系统 设备 可读 介质
【权利要求书】:

1.一种比特数据特征挖掘方法,所述方法包括:

统计未知协议的链路通信数据文件中的每个长度为k的序列出现位置,并对所述序列出现次数进行统计并排序;

根据每个序列的出现位置计算相邻2个出现位置的位置间隔值,统计各位置间隔值的数量,数量最多的位置间隔值为优势位置间隔值;

根据优势位置间隔值、其出现的次数以及比特数据单元的长度,计算优势位置间隔值出现的比例,对优势位置间隔值出现的比例和设定的阈值比较,根据比较结果确定频繁序列,并依据频繁序列出现的位置,将具有强关联规则的频繁序列归纳为极大频繁模式集;

在极大频繁模式集中提取极大频繁项,将极大频繁项与协议的特征集合对比,查找与极大频繁项相符合的协议特征项即为协议特征序列,获得比特数据单元采用的协议特征和数据格式信息;

所述根据每个序列的出现位置计算相邻2个出现位置的位置间隔值,统计各位置间隔值的数量,数量最多的位置间隔值为优势位置间隔值;具体包括:

步骤2-1)设序列s出现位置的集合为{a1,a2,...aj,...,am},则相邻的2个序列出现位置对应的位置间隔值dj为:

dj=aj+1-aj,1≤j<m (1)

其中,j和m为自然数;定义P为所有dj组成的集合:

{P|dj=aj+1-aj,1≤j<m} (2)

步骤2-2)统计序列s的各位置间隔值出现的数量,若存在数量最多的位置间隔值dj,则位置间隔值dj为优势位置间隔值;当不存在数量最多的位置间隔值时,若存在dj为其他间隔值的最大公约数,则dj为优势位置间隔值;

所述根据优势位置间隔值、其出现的次数以及比特数据单元的长度,计算优势位置间隔值出现的比例,对优势位置间隔值出现的比例和设定的阈值比较,根据比较结果确定频繁序列,并依据频繁序列出现的位置,将具有强关联规则的频繁序列归纳为极大频繁模式集,具体包括:

步骤3-1)统计优势位置间隔值dj实际出现次数,计算其与所述序列s理论出现次数的比例值,其中序列s作为特征序列在无误码情况下的理论出现次数为LD/ls,LD为比特 数据单元D的比特数据长度,ls为特征序列s的位置间隔值;

步骤3-2)比较所述比例值和设定的阈值min_sup,当所述比例值大于设定的阈值min_sup时,则该优势位置间隔对应的序列为频繁序列;

步骤3-3)确定长度为k的具有相同的优势位置间隔的频繁序列iu和iv出现的位置;其中u和v分别为频繁序列的序号;

步骤3-4)根据iu和iv的出现的位置,计算iu和iv以小于k的位置间隔出现的概率,若所述概率大于置信度阈值min_conf,则iu和iv之间具有强关联规则;

步骤3-5)通过遍历,对所有频繁序列的出现位置进行计算,查找所有具有强关联规则的频繁序列,将所有具有强关联规则的频繁序列归纳为极大频繁模式集Lj={i1,i2,...,in}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院国家空间科学中心,未经中国科学院国家空间科学中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910789662.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top