[发明专利]一种分段模式匹配方法及其装置无效

专利信息
申请号: 200610159310.3 申请日: 2006-09-27
公开(公告)号: CN101154228A 公开(公告)日: 2008-04-02
发明(设计)人: 张若渊;阙开良 申请(专利权)人: 西门子公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市柳沈律师事务所 代理人: 张亮
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分段 模式 匹配 方法 及其 装置
【权利要求书】:

1.一种分段模式匹配方法,其特征在于,

步骤1,根据模式字符串中的特殊符号或者根据语言结构将模式字符串划分成至少一个关键字字符串片段,由编译器利用现有匹配算法规则将所述关键字字符串片段生成关键字树,所述关键字树的每个节点都包含至少一个关键字字符串片段,该节点的分支条件是另一个关键字字符串片段;

步骤2,根据模式字符串中的特殊符号或者根据语言结构将用户输入的待处理字符串划分成至少一个待处理字符串片段,作为状态机的输入;

步骤3,由所述状态机根据所述现有匹配算法将所述待处理字符串片段在所述关键字树节点中进行匹配操作;

步骤4,如果在匹配的所述关键字树节点的数据结构中具有模式匹配成功的标志,则记录或者输出该匹配的模式ID;

步骤5,如果所有所述待处理的字符串片段处理完毕,则结束,否则在所述状态机中处理下一个所述待处理字符串片段,重复步骤3-5。

2.根据权利要求1所述的一种分段模式匹配方法,其特征在于所述步骤3中,使用哈希算法或者二分法将待处理字符串片段与节点分支条件进行字符串之间的匹配。

3.根据权利要求1所述的一种分段模式匹配方法,其特征在于还包括一排序步骤,

在步骤1中,将待处理字符串分段后,由一排序单元将所述关键字字符串片段按照预定的顺序排序,并输入所述编译器,由所述编译器生成关键字树;

在步骤2中,将待处理字符串分割成至少一个待处理字符串片段后,由所述排序单元将所述待处理字符串片段按照所述预定顺序输入所述状态机,以进行步骤3至步骤5。

4.根据权利要求1所述的一种分段模式匹配方法,其特征在于还包括一合并步骤:

在步骤1中,将模式字符串分段后,按照下述合并规则由一合并单元将所述关键字字符串片段合并成新的关键字字符串片段:将所述关键字树同一支路中相邻的只具有一个分支的节点合并;或者将上述合并的节点与其最后一个节点相邻的,并且具有至少两个分支的节点合并;合并后输入所述编译器,由编译器重新生成关键字树;

在步骤2中,将待处理字符串分段后,按照上述合并规则,由所述合并单元将所述待处理字符串片段合并成由至少一个待处理字符串片段组成的新的待处理字符串片段,作为所述状态机的输入。

5.根据权利要求3所述的一种分段模式匹配方法,其特征在于还包括一合并步骤:

在步骤1中,将所述关键字字符串片段排序后,按照下述合并规则由一合并单元将所述关键字字符串片段合并成新的关键字字符串片段:将所述关键字树同一支路中相邻的只具有一个分支的节点合并;或者将上述合并的节点与其最后一个节点相邻的,并且具有至少两个分支的节点合并;合并后输入所述编译器,由编译器重新生成关键字树;

在步骤2中,将所述待处理字符串片段排序后,按照上述合并规则由所述合并单元将所述待处理字符串片段合并成由至少一个待处理字符串片段组成的新的待处理字符串片段,作为所述状态机的输入。

6.根据权利要求3所述的一种分段模式匹配方法,其特征在于所述预定顺序包括,按照所述关键字字符串片段和所述待处理字符串片段读入的先后顺序,或者片段的语法结构进行排序,排序后所述键字字符串片段和所述待处理字符串片段的顺序相同。

7.一种分段模式匹配装置,其特征在于包括,

分段器,用于根据模式字符串中的特殊符号或者根据语言结构将模式字字符串和待处理字符串分段;

编译器,与状态机相连接,用于将所述关键字字符串片段生成关键字树;

所述状态机,接收所述分段器传送的待处理字符串片段,利用现有匹配算法将所述待处理字符串片段在所述关键字树节点中进行匹配操作;

输出单元与所述状态机相连接,用于输出与所述待处理字符串的匹配模式编号。

8.根据权利要求7所述的一种分段模式匹配装置,其特征在于还包括一排序单元,用于将由所述分段器输出的至少2个待处理字符串片段和所述关键字字符串片段按照预定顺序分别进行排序,将排序后的所述待处理字符串片段输入所述状态机,将排序后的所述关键字字符串片段输入所述编译器。

9.根据权利要求7所述的一种分段模式匹配装置,其特征在于还包括一合并单元,用于合并所述待处理字符串片段并传送给所述状态机,合并所述关键字字符串片段并传送给所述编译器。

10.根据权利要求7所述的一种分段模式匹配装置,其特征在于还包括一合并单元,用于合并所述经过排序单元的待处理字符串片段,并传送给所述状态机,合并所述经过排序单元的关键字字符串片段,并传送给所述编译器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200610159310.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top