[发明专利]一种基于字典树剪枝搜索的协议关键字识别方法有效

申请号：	201611051833.6	申请日：	2016-11-23
公开（公告）号：	CN106713273B	公开（公告）日：	2019-08-09
发明（设计）人：	衣龙腾;齐维孔;周钠;李明;刘晓晖	申请（专利权）人：	中国空间技术研究院
主分类号：	H04L29/06	分类号：	H04L29/06;G06F16/22
代理公司：	中国航天科技专利中心 11009	代理人：	陈鹏
地址：	100194 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于字典树剪枝搜索的协议关键字识别方法，首先获取需要识别的数据流，将数据流中数据存入循环队列buffer，对buffer中字符串记进行扫描，生成字典树中分支，在每次字典树中分支生成过程中，当满足剪枝条件时计算各个节点的剪枝阈值进行字典树剪枝，最后获取精炼比例PurifyRate，根据精炼比例PurifyRate得到关键字，完成关键字识别。本发明方法通过引入字典树剪枝算法，解决了使用传统字典树算法进行协议关键字识别时使用的存储空间过大的缺陷，具有提高了计算机的空间利用效率的优点，具有较好的使用价值。
搜索关键词：	一种基于字典剪枝搜索协议关键字识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于字典树剪枝搜索的协议关键字识别方法，其特征在于包括如下步骤：(1)获取需要进行协议关键字识别的数据流，建立长度为24的循环队列buffer，将迭代器index定位在数据流第1位，建立变量DataCount记录扫描过的数据流长度，建立变量NodeNum记录字典树中节点数量，建立字典树root，其中，DataCount的初值为0，NodeNum的初值为0；(2)将以index为起点的数据流中的24位数据存入循环队列buffer，将buffer中存放的数据字符串记为A(a₁a₂...a₂₄)，从a₁开始扫描字符串，将当前扫描的字符记为a_i，若字典树root中某个节点存放的字符与a_i相同，则将当前节点的计数值count加1，并将该字符赋值给当前节点，然后继续扫描字符串A(a₁a₂...a₂₄)，若字典树root中任何节点对应的字符都与a_i不同，i＝1，2，3…24，则将a_ia_i+1…a₂₄中的字符分别作为24‑i+1个节点，并连接在字符为a_i‑1的节点上，包括字符a_j的节点的深度depth为j、计数值count为1，NodeNum＝NodeNum+(24‑i+1)，j＝i，i+1，…24，其中，存储字符为a₀的节点为根节点；(3)index＝index+1，DataCount＝DataCount+1；(4)判断变量NodeNum、DataCount，如果NodeNum>MaxNodeNum或者DataCount％CycleTime＝0，则转入步骤(5)，否则转入步骤(2)，直至DataCount+24等于数据流长度，转入步骤(7)；其中，符号％代表求模运算；(5)计算得到深度为depth的节点的剪枝阈值MinCountList[depth]＝DataCount/(2^depth)*10；(6)从字典树的根节点开始遍历字典树，将当前遍历到的节点temp的深度记为depth_t、计数值记为count_t，如果count_t小于MinCountList[depth_t]，则将temp节点、temp节点的所有子节点从字典树中删除，否则继续遍历字典树直至遍历完毕，并转入步骤(2)；(7)用字符串列表StrList记录协议关键字，获取精炼比例PurifyRate，从根节点开始遍历字典树，将当前遍历到节点记为temp，节点temp的深度记为depth_t、计数值记为count_t，节点temp的直接父节点记为parent，节点parent深度记为depth_p、计数值记为count_p，若count_t/count_p<PurifyRate，则将根节点到节点parent的分支上的所有节点记录的字符组成字符串，加入到StrList中，完成关键字识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国空间技术研究院，未经中国空间技术研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611051833.6/，转载请声明来源钻瓜专利网。

上一篇：一种对苯二甲酸改性石英石树脂及其制备方法
下一篇：一种低熔点聚酯及其制备方法

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于字典树剪枝搜索的协议关键字识别方法有效

专利文献下载