[发明专利]一种基于字符串的快速匹配识别方法和装置有效
申请号: | 201910339599.4 | 申请日: | 2018-04-20 |
公开(公告)号: | CN110083746B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 李小坤 | 申请(专利权)人: | 武汉绿色网络信息服务有限责任公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 字符串 快速 匹配 识别 方法 装置 | ||
1.一种基于字符串的快速匹配识别方法,其特征在于,包括:
确定字符串中存在动态变化的一个或者多个字符位,以及相应字符串中的静态字符位;
根据所述字符串中的静态字符位的内容信息和所述一个或者多个动态字符位,更新字符串映射库;
其中,所述字符串映射库中对应于所述一个或者多个动态字符位,相应的以预设的附加字符位进行标定;
所述字符串映射库包括一个或者多个数组阵列,所述数组阵列具体由一个或者多个数组对应字符排列顺序,以层级方式排列构成;其中,数组的级数与字符串中相应字符数量相对应;每一个数组包含数量上与完整字符个数相一致的数组单元,所述预设的附加字符位增设在每一个数组的最后字符位之后;其中,所述数组单元用于存储与之关联的下一级数组的地址;
字符串映射库已经存储有第一字符串,此时,在字符串映射库中导入新增的第二字符串,具体包括:
对于字符串首字符相同的第一字符串和第二字符串,将第一字符串的第一级数组复用给所述第二字符串;
对于第一字符串和第二字符串之间存在差异的第i个字符位,则在第一字符串的数组阵列中,位于相应第i级数组所在链路,新增一条数组来对应第二字符串中第i个字符位内容;从而相对于第i-1级数组,形成了两条第i级数组的下级链路;
在获取到一条第三字符串,需要通过所述字符串映射库,对于所述第三字符串所代表的信息进行解析时,所述方法还包括:
根据所述第三字符串的首字符位的内容,在字符串映射库的数组阵列中匹配出第一级数组中记录信息与所述第三字符串的首字符位的内容一致的一个或者多个候选数组阵列;
依次根据所述第三字符串的后续字符位的内容,筛选所述一个或者多个候选数组阵列,得到第三字符串对应的解析结果;
完整字符个数的数组单元具体包括对应0x00-0xFF的总共256个数组单元,则所述附加字符对应设置为数组中的第257数组单元,其中,各数组单元用于存储其下一级数组的地址信息或者用于存储跳出当前数组阵列得到匹配结果的相应信息。
2.根据权利要求1所述的基于字符串的快速匹配识别方法,其特征在于,用于存储跳出当前数组阵列得到匹配结果的相应信息,具体包括:
对应每一字符串的数组阵列的最后一级数组中存储有跳转地址链接,所述跳转地址链接用于获取与所述字符串相匹配的解析结果;或者,
对应每一字符串的数组阵列的最后一级数组中存储有与所述字符串相匹配的解析结果。
3.根据权利要求1所述的基于字符串的快速匹配识别方法,其特征在于,所述依次根据所述第三字符串的后续字符位的内容,筛选所述一个或者多个候选数组阵列,得到第三字符串对应的解析结果,具体包括:
将后续字符位设定为静态字符位进行匹配,若未匹配得到唯一的结果,则选择性的将后续字符位设定为动态字符位,并将调整后的后续字符位进行匹配,直到匹配到唯一的结果,或者,抵达跳出匹配循环条件后,反馈未匹配成功的消息给操作人员。
4.根据权利要求3所述的基于字符串的快速匹配识别方法,其特征在于,所述选择性的将后续字符位设定为动态字符位,具体包括:
从上一轮匹配过程中,最后失配的字符位调整为动态字符位,并以上一轮失配时,新调整为动态字符位的前一字符位所对应的数组为起始,进行当前轮的匹配过程;
若还出现下一个字符位失配,则重复上述调整过程,并完成整个字符串的匹配过程;
其中,对于同一字符位,若在其调整为动态字符位后,仍然未匹配成功,则确认抵达跳出匹配循环条件,并反馈未匹配成功的消息给操作人员。
5.根据权利要求1-4任一所述的基于字符串的快速匹配识别方法,其特征在于,所述确定字符串中存在动态变化的一个或者多个字符位,以及相应字符串中的静态字符位,具体包括:
比对预设时间段内的数据包中获取的第四字符串和第五字符串,若第四字符串和第五字符串之间相似的字符位的个数与差异的字符位的个数之间的个数比值结果大于预设阈值,则标注出所述第四字符串和第五字符串;
根据输入端反馈的所述第四字符串和第五字符串属于同一解析结果的确认消息;确定第四字符串和第五字符串之间存在差异的字符位为所述动态变化的字符位,并且第四字符串和第五字符串之间内容相同的字符位为所述静态字符位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉绿色网络信息服务有限责任公司,未经武汉绿色网络信息服务有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910339599.4/1.html,转载请声明来源钻瓜专利网。