[发明专利]用于检索的方法和装置无效
申请号: | 87100829.7 | 申请日: | 1987-02-14 |
公开(公告)号: | CN1016835B | 公开(公告)日: | 1992-05-27 |
发明(设计)人: | 大曾根匡;杉本彰;北岛弘行;土田正士;谷口伸博;山下芳明 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F15/40 | 分类号: | G06F15/40 |
代理公司: | 中国国际贸易促进委员会专利代理部 | 代理人: | 赵越 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检索 方法 装置 | ||
本发明一般性地涉及到直接检索一个文本或一个符号串的检索技术,以及按检索单位来检索声音和图形的方法和装置。特别涉及到适用于高速符号串检索处理的检索方法和装置。
本发明的代表性应用是文本检索,此领域的先有技术将描述如下。
随着办公室自动化的发展,把文件信息作为数据库已迅速地得到推广,同时数据库的规模也日趋增大。因此,加速数据库对文件信息的处理是一项有意义的任务。文本检索在文件信息处理中是一个重要的项目,它是从一个由字符串组成的文本中检索出一个特定的字符串模式。因此就希望能有一种快速文本检索的处理方法。
过去曾提出过各种形式的文本检索和装置。例如,“用于文本信息检索的硬件系统”(Hard Ware System for text Informatron Retrieval)由Hollaar L.A.,ACMSIGIR 6th Conf.1983著,描述了单元阵列方法,其中字符串模式以阵列形式一个一个地存储在一寄存器中,同时模式的检测是由将文本的字符从首字符开始一个一个地输入到寄存器中进行的。在该文章中还描述了有限状态自动法,它是将文本字符从首字符开始,一个一个地送到有限状态自动机,然后参照状态转换表检测出特定的模式。这两种先有技术所采用的方法都是从文本首字符开始,一个一个地提供字符,因此对于长度为n字符的文本,必须输入所有的n个字符,这在原理上就阻碍快速处理。
另一方面,以软件为基础的文本检索方法有由Kunuth D.E等人在“Past Pattern Matching in Strings”STAM。J Comput,Vol.6,PP323-350,1977文中所描述的KMP方法以及由Boyer R.S等人在“A Fast String Seaching Algorithin”CACM,Vol.20PP 762-772,1977文中所描述的BM方法。在这些方法中,文本及模式的字符都是一个一个地取出来比较,各种处理都是根据比较的结果进行的。这些方法的缺点是软件的方法不适用于高速处理,此外,对于硬件的实现也不适合。
如上所述,先有技术的方法和手段在于算法的问题,该问题是所有的与文本长度相等的n个字符必须一个一个按顺序地输入以检测一个特定的模式。
本发明的目的是提供一种用于检索的方法和装置,它可高速地检测出一种模式,是通过减少输入文本字符或符号的数目来实现的。
根据本发明,为实现上述目的,需要有若干个存储信息的表格。利用这些表格,并参照当前的检索状态和表示输入符号(至少一个)的信息,就可容易地计算出符号串中下一个要输入的符号的地址和符号串的下一个检索状态,同时当输入了一个符号串的符号时,就根据当前的检索状态和表示输入符号的信息去存取这些表格,查找存放在表格中的数据以得到下一个检索状态和下一个要输入符号的地址。该地址的符号就接着被输入从而至少可检测到一个包含在该符号串中的预先确定的模式(所谓的关键字)。
图1是一个框图,它是根据本发明的一个实施方案给出的一种文本检索装置。
图2是根据本发明得出的文本检索的流程图。
图3到图5是用来说明本发明文本检索的图表。
图6和图7是图1实施方案中使用的例表。
图8是图1实施方案中使用的文本表的一个例子。
图9是一个表用于说明图1实施方案的操作。
图10是一个框图,它是根据本发明的另一个实施方案给出的一种符号串检索装置。
图11是根据本发明得出的符号串检索的流程图。
图12和图13是用以说明本发明符号串检索的图表。
图14是用于符号串检索所使用的检索状态表。
图15是以说明本发明的状态转换的图表。
图16是用于符号串检索所使用的一个状态转换表。
图17是用于符号串检索所使用的跳越表。
图18是图10实施方案中所使用的状态转换表。
图19是图10实施方案中所使用的文本表。
图21是用于说明图10实施方案操作的一个表。
下面参照文本检索介绍本发明的第一个实施方案,文本检索是本发明的主要应用领域。在描述本发明的文本检索过程中有以下约定:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/87100829.7/2.html,转载请声明来源钻瓜专利网。