[发明专利]字符串的匹配方法及装置有效
申请号: | 201210316986.4 | 申请日: | 2012-08-30 |
公开(公告)号: | CN102831232A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 常磊 | 申请(专利权)人: | 山石网科通信技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;余刚 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 匹配 方法 装置 | ||
技术领域
本发明涉及互联网领域,具体而言,涉及一种字符串的匹配方法及装置。
背景技术
现有技术的互联网技术中,在对某些敏感词或者关键词进行匹配以达到筛选或者过滤时,会在确定被匹配的字符串后,分别将输入的数据中的每个字符串与被匹配的字符串进行匹配,输入的数据中大量不同的未被匹配的字符串在进行匹配的过程中,占用了大量的内存,降低了匹配的速度和效率。
针对现有技术中进行匹配的速度较慢的问题,目前尚未提出有效的解决方案。
发明内容
本发明提供了一种字符串的匹配方法及装置,以至少解决现有技术中进行匹配的速度较慢的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种字符串的匹配方法。
根据本发明的字符串的匹配方法包括:获取字符映射表,其中,在字符映射表中,所有与预设字符串中的字符不同的字符均对应于第一映射字符,第一映射字符与预设字符串中的字符在字符映射表中的映射字符均不同;接收输入数据;获取输入数据中的字符在字符映射表中的映射字符;以及将获取到的映射字符组成的字符串与预设字符串在字符映射表中的映射的字符串相匹配。
进一步地,获取字符映射表包括:获取预设字符串中不同字符的数量M;获取预设字符串中的字符在字符映射表中的映射字符,其中,预设字符串中的字符按顺序映射为0至M-1;以及获取与预设字符串中的字符不同的字符在字符映射表中的映射字符M。
进一步地,获取输入数据中的字符在字符映射表中的映射字符包括:获取URL中与预设字符串中的字符相同的字符在字符映射表中的映射字符;以及获取URL中与预设字符串中的字符相同的字符在字符映射表中的映射字符M。
进一步地,获取字符映射表包括:将与预设字符串中的字符相同的字符映射为字符本身;以及将所有与预设字符串中的字符不同的字符映射为第一映射字符,其中,第一映射字符与预设字符串中的字符均不同。
进一步地,将获取到的映射字符组成的字符串与预设字符串在字符映射表中的映射的字符串相匹配之后,上述方法还包括:获取由经过映射的输入的数据中的字符构成的矩阵;以及存储由矩阵的下标和值组成的二元组以压缩矩阵。
为了实现上述目的,根据本发明的另一个方面,提供了一种字符串的匹配装置,该装置用于执行本发明提供的任意一种字符串的匹配方法。
根据本发明的另一方面,提供了一种字符串的匹配装置。该字符串的匹配装置包括:第一获取单元,用于获取字符映射表,其中,在字符映射表中,所有与预设字符串中的字符不同的字符均对应于第一映射字符,第一映射字符与预设字符串中的字符在字符映射表中的映射字符均不同;接收单元,用于接收输入数据;第二获取单元,用于获取输入数据中的字符在字符映射表中的映射字符;以及匹配单元,用于将获取到的映射字符组成的字符串与预设字符串在字符映射表中的映射的字符串相匹配。
进一步地,第一获取单元包括:第一获取子单元,用于获取预设字符串中不同字符的数量M;第二获取子单元,用于获取预设字符串中的字符在字符映射表中的映射字符,其中,预设字符串中的字符按顺序映射为0至M-1;以及第三获取子单元,用于获取与预设字符串中的字符不同的字符在字符映射表中的映射字符M。
进一步地,第二获取单元包括:第四获取子单元,用于获取URL中与预设字符串中的字符相同的字符在字符映射表中的映射字符;以及第五获取子单元,用于获取URL中与预设字符串中的字符相同的字符在字符映射表中的映射字符M。
进一步地,第一获取单元包括:第一映射子单元,用于将与预设字符串中的字符相同的字符映射为字符本身;以及第二映射子单元,用于将所有与预设字符串中的字符不同的字符映射为第一映射字符,其中,第一映射字符与预设字符串中的字符均不同。
进一步地,上述装置还包括:第三获取单元,用于获取由经过映射的输入的数据中的字符构成的矩阵;以及压缩单元,用于存储由矩阵的下标和值组成的二元组以压缩矩阵。
通过本发明,将所有预设字符串中没有出现过的字符都映射到同一个字符,因此在进行匹配的过程中,仅需识别某一字符是否与预设字符串中的字符匹配,而不用分别识别各个未被匹配的字符,减小了进行匹配时的内存的占用,提高了匹配的速度,解决了现有技术中进行匹配的速度较慢的问题,进而提高了匹配的效率。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的字符串的匹配装置的结构框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山石网科通信技术(北京)有限公司,未经山石网科通信技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210316986.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拉丝陶瓷加工装置及其加工方法
- 下一篇:一种电力接地棒的拔出装置