[发明专利]一种多模式匹配方法、装置、电子设备和存储介质在审
申请号: | 202110693846.8 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113377917A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 任禾;刘升平;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模式 匹配 方法 装置 电子设备 存储 介质 | ||
1.一种多模式匹配方法,其特征在于,包括:
获取待匹配文本;
将所述待匹配文本符号化转化成符号序列;
从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据所述符号序列中的每个符号类型确定匹配策略;
从所述根节点到所述子节点的路径中得到匹配结果;
其中,所述符号类型包括:文字类型、数字类型、区间类型或者活动节点。
2.根据权利要求1所述的多模式匹配方法,其特征在于,将所述待匹配文本符号化转化成符号序列,包括:
通过符号化工具对所述待匹配文本的字符表达进行字符切分,形成不同的符号类型;
所述符号序列中每个符号用第一分隔符隔开;
每个符号均包括两部分,第一部分是符号本身,第二部分是符号类型,所述第一部分和第二部分用第二分隔符隔开。
3.根据权利要求1所述的多模式匹配方法,其特征在于,所述从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,包括:
从字典树的根节点开始匹配所述符号序列中第一个符号对应的子节点;
当匹配到第一个符号对应的子节点后,从所述子节点开始匹配所述符号序列中第二个符号的子节点;
依次匹配直到匹配完符号序列中最后一个符号对应的子节点后得到匹配结果。
4.根据权利要求1所述的多模式匹配方法,其特征在于,根据所述符号序列中的每个符号类型确定匹配策略,包括:
当符号类型是活动节点时,如果当前字符和所述活动节点匹配成功,仍然在所述活动节点匹配下一个字符;
当符号类型是区间节点时,当前字符与所述区间节点中的每一个字符进行匹配。
当符号类型包括至少两种时,对当前字符进行转写或者保留,进行匹配。
5.根据权利要求1所述的多模式匹配方法,其特征在于,所述将所述待匹配文本符号化转化成符号序列后,所述符号序列通过树构建工具放在字典树上。
6.根据权利要求1所述的多模式匹配方法,其特征在于,所述从所述根节点到所述子节点的路径中得到匹配结果后,所述方法还包括:通过结果选择单元确定最终匹配结果。
7.根据权利要求1所述的多模式匹配方法,其特征在于,所述从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,包括:通过字典树匹配逻辑单元进行匹配。
8.一种多模式匹配装置,其特征在于,包括:
获取模块:用于获取待匹配文本;
转化模块:用于将所述待匹配文本符号化转化成符号序列;
匹配模块:用于从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据所述符号序列中的每个符号类型确定匹配策略;
得到模块:用于从所述根节点到所述子节点的路径中得到匹配结果;
其中,所述符号类型包括:文字类型、数字类型、区间类型或者活动节点。
9.一种电子设备,其特征在于,包括:处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至7任一项所述一种多模式匹配方法。
10.一种计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至7任一项所述一种多模式匹配方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110693846.8/1.html,转载请声明来源钻瓜专利网。