[发明专利]一种用于数据检索的搜索系统和方法及其在搜索引擎中的应用无效
申请号: | 99810507.4 | 申请日: | 1999-07-09 |
公开(公告)号: | CN1317114A | 公开(公告)日: | 2001-10-10 |
发明(设计)人: | K·M·里斯维克 | 申请(专利权)人: | 快速检索及传递公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王勇,张志醒 |
地址: | 挪威*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于信息检索的搜索系统包含一个用于存储正文T中的数据结构,一个包含分别关于正文T字和/或符号及其序列和序列P中的字和/或符号之间的匹配的近似程度的编辑距离尺度的组合尺度M,对将序列S的字或符号转换成序列P的编辑操作的成本函数进行加权;和用于分别确定分别在正文T和查询Q的后缀树表示中的字或字序列之间的匹配程度的搜索算法。该算法以查询Q搜索该数据结构,以与该查询的具体匹配检索信息。该搜索系统的一种用于信息检索的方法生成字间隔稀疏后缀树用于存储正文T中的字的后缀作为字序列信息,以及一个用于字序列S和P的与字的大小有关的编辑距离尺度,并且包括编辑距离的字加权成本函数,以及通过计算关于所有匹配的编辑距离确定字序列SR或被检索的信息R与一个查询Q的字序列PQ之间的匹配程度。还公开了该搜索算法在近似搜索引擎中的应用。 | ||
搜索关键词: | 一种 用于 数据 检索 搜索 系统 方法 及其 搜索引擎 中的 应用 | ||
【主权项】:
1.一种用于信息-特别是以正文T的形式存储的信息-检索的搜索系统,其中,信息检索以查询Q与被检索信息R之间的给定或不同程度的匹配而发生,其中,该搜索系统包含一个用于存储正文T的数据结构,一个测量查询Q与被检索信息R之间匹配程度的尺度M,以及用于执行搜索-特别是以键字为基础的全文搜索-的搜索算法,其特征在于,该数据结构包含一个以后缀树ST(T)为形式的树结构,用于存储正文T中的字、字序列和符号序列的后缀;尺度M包含关于正文T中的字或符号与查询Q之间匹配的近似度的编辑距离尺度与关于正文T中的字或符号的序列S与查询序列P之间匹配的近似度的编辑距离尺度的组合,后一个编辑距离尺度包括对将一种字或符号的序列S转换成另一种字或符号的序列P的编辑操作的成本函数进行加权,该搜索算法包含用于确定正文T与查询Q各自的后缀树表示中的字之间的匹配程度的第一算法和/或用于确定正文T与查询Q各自的后缀树表示中的字的序列之间的匹配程度的第二算法,所述第一和/或第二算法用以字、字序列、符号序列或者它们的组合为形式的查询Q搜索数据结构,使得信息R被根据查询Q而检索出来,前者与后者之间具有规定的匹配程度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于快速检索及传递公司,未经快速检索及传递公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/99810507.4/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置