[发明专利]使用结构化数据储存库实现更快的全文搜索无效
申请号: | 201080060959.4 | 申请日: | 2010-11-09 |
公开(公告)号: | CN102834802A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | H.S.耶曼泽 | 申请(专利权)人: | ARC景象有限责任公司 |
主分类号: | G06F7/00 | 分类号: | G06F7/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 段俊峰;卢江 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 利用传统的结构化数据储存库来提供非结构化全文搜索系统的益处。固定数量的“扩展”列被添加到传统的结构化数据储存库,以形成“增强型结构化数据储存库”(ESDS)。扩展列独立于数据的任何规则分列式解释以及使得能够使用可以更快执行的标准全文查询句法/技术(与SQL句法相反)来搜索它们存储的数据。换句话说,添加的列用作搜索索引。基于标记的哈希值将该标记存储在合适的扩展列中。使用哈希方案来确定哈希值,所述哈希方案基于标记的值而不是标记的含义来操作。这使得后续的搜索能够被表达为全文查询,而不会使得随后的搜索退化为强力扫描。 | ||
搜索关键词: | 使用 结构 数据 储存库 实现 全文 搜索 | ||
【主权项】:
一种用于将信息存储在结构化数据储存库内的条目中的计算机实现方法,其中,所述条目包括一个或多个基本字段以及一个或多个扩展字段,所述方法包括:接收字符串;从所述字符串提取信息;基于提取的信息的含义将提取的信息存储在所述条目的所述一个或多个基本字段中;识别所述字符串的将使得能够进行更快搜索的一部分;将所述字符串的所识别的部分解析为多个标记;以及对于所述多个标记中的每个标记: 基于哈希方案确定所述标记的哈希值;以及 将所述标记存储在与确定的哈希值对应的扩展字段中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ARC景象有限责任公司,未经ARC景象有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201080060959.4/,转载请声明来源钻瓜专利网。
- 上一篇:集成电路设备时序校准
- 下一篇:亲和色谱用填充剂以及离析免疫球蛋白的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置