[发明专利]用于搜索多个串的方法和系统有效
申请号: | 201410757944.3 | 申请日: | 2010-02-26 |
公开(公告)号: | CN104484381B | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 张林 | 申请(专利权)人: | 电子湾有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李晓冬 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 搜索 多个串 方法 系统 | ||
本发明涉及用于搜索多个串的方法和系统。该系统可以包括:存储分别以第一字开始的图样串;对于每个不同的第一字,存储该第一字和以该第一字开始的图样串的每个不同串长度的组合;在文本中识别与第一图样字之一相匹配的字;迭代地基于以识别出的字开始的串从文本中提取串,并将与串长度之一相等的串长度与匹配的第一字一起存储;迭代地将每个提取出的串和具有与该子串相同的第一字和串长度的每个图样串相比较;以及基于该比较确定至少一个提取出的串与所述图样串之一匹配。
本申请是原案申请号为201010116709.X的发明专利申请(申请日:2010年2月26日,发明名称:用于搜索多个串的方法和系统)的分案申请。
技术领域
本发明一般地涉及信息处理的技术领域,更具体而言,涉及用于信息搜索的方法和系统。
背景技术
随着计算机和网络相关技术的发展,越来越多的人执行数字搜索来识别或找到数字文档中满足他们的需求的特定内容。例如,人们(例如父母)或权威机构可以尝试在孩子们可获得的数字文档中找到某些不适合孩子的限制内容(例如串、表达或词),然后使得孩子们远离这些内容。但是,在很多情形中,由于例如数字文档的大小和/或数量庞大,人们或权威机构识别或找到这些限制内容是一项耗时的任务。因此,需要改进的搜索方法,用来执行高效的搜索和减少搜索时间。
发明内容
本申请的目的是要提供用于基于多个串的第一字和长度的组合来高效地执行对多个串的搜索以减少搜索时间的系统和方法。
根据本申请的第一方面,提供了一种用于通过使用一个或多个处理器执行驻留在计算机中的指令来从文本中搜索多个串的系统。该系统包括:第一存储设备,用于存储分别以第一图样字开始的图样串;以及第二存储设备,用于存储以第一图样字开始的图样串的第一图样字和相应的图样长度的组合。该系统还包括:搜索引擎,用于在文本中迭代地识别与所述第一图样字之一相匹配的字以设置为当前字;提取器,用于迭代地提取以所述当前字开始并具有与图样长度之一相等的子串长度的子串;以及比较器,用于迭代地将所述子串与具有与该子串的第一图样字和长度相同的第一图样字和串长度的每个图样串相比较。该系统还可以包括第三存储设备,用于在该子串与图样串之一相匹配的情况下存储与该子串相关的信息。
根据本申请的另一方面,提供了一种用于通过使用一个或多个处理器执行驻留在计算机中的指令来从文本中搜索多个串的方法。该方法包括:将分别以第一图样字开始的图样串存储在第一存储设备中;并将分别以第一图样字开始的图样串的第一图样字和相应的图样长度的组合存储在第二存储设备中。该方法还包括:利用搜索引擎在文本中迭代地识别与所述第一图样字之一相匹配的字,以设置为当前字;利用搜索引擎迭代地提取以所述当前字开始并具有与图样长度之一相等的子串长度的子串;利用搜索引擎迭代地将该子串与具有与该子串的第一图样字和长度相同的第一图样字和串长度的每个图样串相比较;以及如果该子串与图样串之一相匹配,则将与该子串相关的信息存储在第三存储设备中。
本申请的系统和方法可以在文本中高效地找到和定位一系列以使用大字符集(charset)的语言(例如中文)书写的预先定义的图样串(例如中文词)。本申请所采用的技术考虑使用大字符集的语言的特性,并且可以获得线性的运行时间并减少搜索时间。该技术可被例如用于在公告板系统(BBS)线程中禁止包含一个或多个预先定义的图样字的文本。
附图说明
在附图中以示例的方式而非限制的方式图示出本发明的实施例,附图中的相似标号指示相似元件,在附图中:
图1是图示出根据示例性实施例的用于从文本中搜索多个目标图样串(targetpattern string)的系统的框图;
图2是图示出根据示例性实施例的用于从文本中搜索多个目标图样串的方法的流程图;以及
图3是以计算机系统的示例性形式图示出根据示例性实施例的机器的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子湾有限公司,未经电子湾有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410757944.3/2.html,转载请声明来源钻瓜专利网。