[发明专利]一种空间链路协议盲识别方法与系统有效
申请号: | 201310362097.6 | 申请日: | 2013-08-19 |
公开(公告)号: | CN103414722A | 公开(公告)日: | 2013-11-27 |
发明(设计)人: | 姚秀娟;孟新;陈玲;李雪;闫毅;高翔 | 申请(专利权)人: | 中国科学院空间科学与应用研究中心 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/26 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 空间 协议 识别 方法 系统 | ||
技术领域
本发明涉及空间数据通信领域,特别是涉及空间链路协议数据格式识别和标准化检测领域,尤其是针对缺乏目标协议先验知识的情况下,本发明提供了一种从比特流数据中进行空间链路协议盲识别的方法。
背景技术
在目前的空间数据通信中,广泛采用空间链路协议来组织和管理各类型的空间数据信息。空间链路协议是空间链路信息系统的骨架和神经,是维系信息正常传递的纽带。协议识别是采用一定的算法和工具,通过特征分析,确定目标信息所采用的协议类型,明确目标信息的数据格式,为进一步的信息应用奠定基础。
目前,对空间链路协议的研究主要集中于已知协议的应用技术及标准化检测方面。在已知协议的应用和标准化检测领域,用户必须掌握一定的先验知识,预先已经知道所应用或检测的协议类型,预先掌握协议的格式定义,包括协议的帧头和帧尾信息、帧长度信息,才能够将获取到的目标信息与已知协议的帧格式按照固定的帧长度进行搜索匹配,达到协议应用和检测的目的。
在空间链路协议应用过程中,当用户并不能够掌握所获取的目标数据格式时,即用户缺乏目标数据的先验知识,不具备进一步分析和应用的条件时,迫切需要一种在不需要先验知识的情况下,能够从比特流数据中自动识别出空间链路协议帧格式的方法。
Apriori数据挖掘算法是空间链路协议帧格式检测中常用的算法,它对短模式文本数据具有很好的挖掘效果。但在空间链路协议盲识别中,识别对象是海量的比特流数据,并且缺乏先验知识,传统的Apriori数据挖掘算法不再适用。主要有以下2点缺陷:
1)Apriori算法需要对数据序列做多次扫描。每扩展一位长度的频繁模式就需要扫描一次数据序列,最终总的扫描次数相当于最长频繁模式的长度。因此,对于数据序列庞大,频繁模式较长的情况,挖掘效率相当低下。
2)扫描过程中可能产生大量的候选模式。如果短长度频繁模式过多,则通过连接运算扩展敏感信息长度时将会产生大量的候选模式,增加了空间和时间的开销,甚至会导致挖掘处理器溢出。
对于空间链路协议来说,我们所需要识别的对象是比特流数据,只有’0’、’1’两个字符,其字符集大小仅为2,并且模式串为一定长度的位流数据,长度也比较长。若采用普通数据挖掘算法,需要多次扫描数据库,并产生大量候选模式。
发明内容
本发明的目的在于,为实现在不具备先验知识的情况下,进行空间链路协议盲识别的目的,本发明提供了一种能够从比特流数据中自动识别出所用协议的数据格式的方法。
为实现上述目的,本发明提供一种空间链路协议盲识别方法,所述方法包含:
步骤101)对待盲识别文件中的目标数据转化为十六进制数据;
步骤102)基于得到的十六进制数据找到指定长度范围内的所有的频繁序列组成初始频繁序列集,并对初始频繁序列集中包含的各指定长度的序列出现过的次数进行计数;
步骤103)将统计得到的频繁序列的计数值与若干设定的min_threshold值逐一进行比较,将计数值大于min_threshold的频繁序列存入中间频繁序列集中,其中,依据每个不同的min_threshold值均可以筛选得到一个中间频繁序列集;
步骤104)采用模式匹配的方法,将中间频繁序列集中的所有序列逐一在目标数据中搜索定位,并计算两个相同的频繁序列出现的间隔,即位置差,将所有等间隔的频繁序列从中间频繁序列集中提取出来,组成目标频繁序列集;
步骤105)将挖掘得到的目标频繁序列集与空间链路协议帧同步字敏感信息进行模式匹配,判断所应用的协议类型,完成协议盲识别。
上述步骤102)进一步包含如下子步骤:步骤102-1)枚举目标数据中所有长度为1~k的模式序列,组成初始频繁序列集;
步骤102-2)建立k个缓存单元,其中任意一个缓存单元为Buff[i],且i的取值范围为:i=1......k;
步骤102-3)在Buff[1]中记录序列中第k位字符的计数情况m1;
在Buff[2]中记录序列中第k位字符和第“k-1”位字符的计数情况m2;
在Buff[3]中记录序列中第k位字符和第“k-1”位字符、第“k-2”位字符的计数情况m3;以此类推,在Buff[k]中记录序列中第k位字符、第“k-1”位字符、第“k-2”位字符、第“k-3”位字符......第1位字符的计数情况mk;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空间科学与应用研究中心,未经中国科学院空间科学与应用研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310362097.6/2.html,转载请声明来源钻瓜专利网。