[发明专利]基于决策树剪枝的模式匹配方法有效

专利信息
申请号: 201610367542.1 申请日: 2016-05-30
公开(公告)号: CN106067039B 公开(公告)日: 2019-01-29
发明(设计)人: 古天龙;王亚南;徐周波;常亮;陈帅;王敏 申请(专利权)人: 桂林电子科技大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 桂林市持衡专利商标事务所有限公司 45107 代理人: 陈跃琳
地址: 541004 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种基于决策树剪枝的模式匹配方法,其结合决策树剪枝方法的简化AC算法,包括自动机的生成、自动机的简化、计算失败指针、存储后缀表与匹配的执行等步骤。本发明将传统自动机类型模式匹配算法拆分为两个步骤:匹配可能的判定与匹配确认。通过简化自动机判别文本串与模式集中模式串有无匹配的可能,再进行匹配的确认。在保证速度的前提下,本发明提出的简化方法相比传统自动机类型模式匹配算法内存消耗减少35%‑40%。此外,本发明通过决策树剪枝方法可有效减小自动机规模,删除对分类判定无用的节点,有效降低传统自动机类型模式匹配的内存消耗。
搜索关键词: 基于 决策树 剪枝 模式 匹配 方法
【主权项】:
1.基于决策树剪枝的模式匹配方法,其特征是,包括如下步骤:步骤A.即根据自动机生成规则,将模式集中的模式串依次添加到自动机中;步骤B.在自动机生成过程中,每一个模式串添加完成,即将此模式串添加到当前节点的输出表中;步骤C.对生成的自动机进行剪枝,去除对分类来说属于非必要的节点,减少自动机节点数量,简化自动机;在对自动机进行剪枝的过程中,生成后缀表;即:步骤C1.对自动机的各个分支进行逐个遍历;步骤C2.当从根节点遍历至终端叶子节点的过程中,仅存在终端叶子节点这一个输出节点,即输出节点为1个时,则从终端叶子节点开始向上回溯至最后一个单分枝节点,将该单分枝节点的剪枝标志位置为1,修剪掉该单分枝节点之后的枝叶,并将该单分枝节点的后续枝叶包含的后缀以字符串的形式存储于后缀表;步骤C3.当从根节点遍历至终端叶子节点的过程中,存在除终端叶子节点这一个输出节点之外的其他输出节点,即输出节点为2个以上时,则从终端叶子节点开始向上回溯至倒数第二个输出节点,将该倒数第二个输出节点的剪枝标志位置为1,修剪掉该倒数第二个输出节点之后的枝叶,并将该倒数第二个输出节点的后续枝叶包含的后缀以字符串的形式存储于后缀表;步骤D.计算自动机各节点的状态深度,其中节点的状态深度为该节点距根节点的最短路径长度;步骤E.根据节点状态深度,计算出各节点的失败指针;步骤F.依次取出文本串中字符输入自动机,完成模式匹配。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610367542.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top