[发明专利]一种通信系统中字符串匹配信息的处理方法无效

专利信息
申请号: 200610063179.0 申请日: 2006-10-17
公开(公告)号: CN101165681A 公开(公告)日: 2008-04-23
发明(设计)人: 康玉东;王宇飞 申请(专利权)人: 中兴通讯股份有限公司
主分类号: G06F17/30 分类号: G06F17/30;H04L29/06
代理公司: 深圳市永杰专利商标事务所 代理人: 曹建军
地址: 518057广东省深圳市南山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通信 系统 字符串 匹配 信息 处理 方法
【说明书】:

技术领域

本发明涉及一种字符串匹配信息的处理方法,尤其是一种通信系统中字符串匹配信息的处理方法。

背景技术

目前查找字符串的方法比较多,比较经典的是BM(boyer-moore,坡艺尔-摩尔)算法和状态机法。这两种算法的共同特点都是对待查找的字符串P进行预处理,生成各自的辅助目标P’,然后利用P’进行字符串的查找。

BM算法根据待查找的字符串P生成滑动跨度P’,如图1所示,其查找方法如下:把P中的字符和文本字符串T中的字符按从后往前的顺序进行比较,先把P中的末尾字符和T中的字符进行比较,如果相同,再比较P中的前一个字符和T中的前一个字符。如果相同,根据比较的结果读取响应字符的滑动跨度,按照滑动跨度往后滑动,这样,如果字符串P得不到匹配,P就会往后滑动,直到在文本字符串T中找到待查找的字符串P。这种方法适合查找字符串P比较长,查找过程中往后滑动的平均跨度相对较长,效率较高;但是对于较短的字符串效率较低。

状态机方法构建的P’是一个状态机,由状态机来进行字符串的匹配。例如要寻找的字符串是P:AABC,那么要构建的状态机如图2所示。

状态机是根据P作出来的,输入的文本字符串是T,可以看出,当状态到达最后一个“×”时,也就是字符串匹配成功了。输入字符串的次数就是所找字符在字符串中的位置。可以利用这种方法编写一个函数实现状态机,函数的入参是要匹配的字符串P和要输入的文本字符串T,每次匹配时动态创建一个状态机。这种方法的缺点是当要匹配的字符串P比较长时,状态机的生成相对比较麻烦。如果m表示P的字符个数,那么状态机的复杂度是以m的平方增加的。

这两种方法都能在给定的文本字符串T中找到要查找的字符串P,且效率比较高,但是却不能对于P字符串中若干关键子字符串同时进行匹配。这需要对字符串P进行更详细的处理,达到能匹配P中多个关键子字符串的功能。

目前关键字查找方法中,美国的斯蒂尔.P.尼克额尔在专利号为90107971.5的《具有部分关键字分支的前缀检索树》中提出的关键字查找算法将前缀关键字节点构成前缀索引树,用这种方法可以从正文中查找出多个关键字,但该种方法无法同时支持字符串的精确匹配。

发明内容

本发明要解决的技术问题是提供一种能在通信系统中同时实现字符串精确匹配和多通配符匹配的匹配信息的处理方法。

本发明解决其技术问题所采用的技术方案是:

一种通信系统中字符串匹配信息的处理方法,包括以下步骤:

A、按照是否需要支持多通配符匹配确定字符串的匹配类型为精确匹配或者多通配符匹配;

B、根据所述字符串的匹配类型,构造不同类型的匹配结构体:

若为精确匹配类型,则:

B1、提取所述字符串的长度信息,并构造精确匹配结构体;

若为多通配符匹配类型,则:

B2、提取所述字符串所需要匹配的各子字符串,并构造与所述各子字符串一一对应的多通配符结构体;

C、为所述字符串构造对应的匹配信息描述符,

若为精确匹配类型,则:

C1、所述匹配信息描述符包含指向所述精确匹配结构体的指针,根据所述字符串的长度信息,将所述匹配信息描述符链入具有相同字符串长度信息的精确匹配散列索引链表;

若为多通配符匹配类型,则:

C2、所述匹配信息描述符包含指向所述各多通配符结构体的指针,且将所述匹配信息描述符链入多通配符匹配的单链表。

所述步骤B1中生成的精确匹配结构体包含所述字符串的长度信息和所述字符串的原型信息。

所述步骤B2中生成的多通配符匹配结构体包含相应的子字符串的长度信息、ASIC码和所述ASIC码对应的滑动跨度信息;所述滑动跨度信息为利用坡艺尔-摩尔算法计算得到。

所述匹配信息描述符中指向各多通配符结构体的指针与所述字符串中的各子字符串一一对应;所述步骤C中生成的匹配信息描述符还包括所述字符串的匹配类型信息以及所述字符串中包含的子字符串数量信息。

本发明的有益效果主要表现在:本发明所述的匹配信息处理方法能同时支持字符串的精确匹配和多通配符匹配,对精确匹配的情况,采用HASH(散列)管理,主动提取字符串的相关信息,提高了查找速度;对多通配符匹配的情况,则将字符串转化为多个子字符串的组合,采用经典BM算法,效率优于状态机算法。总的说来,本发明所述方法可满足通信系统在精确匹配和多通配符匹配情况下的实时匹配要求。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200610063179.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top