[发明专利]数据检索方法及装置有效
申请号: | 201010588551.6 | 申请日: | 2010-12-14 |
公开(公告)号: | CN102024047A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | 石柱国;余孟春;谢清禄;王堃;陈新宾 | 申请(专利权)人: | 青岛普加智能信息有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 266555 山东省青岛市青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 检索 方法 装置 | ||
1.一种数据检索方法,其特征在于,包括:
获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以获取所述词语索引模块中预置的与所述检索关键词对应的词语标识信息;
根据所述词语标识信息查询反向索引模块,以获取所述反向索引模块中预置的与所述词语标识信息对应的压缩存储的文档信息;
对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
根据所述检索关键词和所述文档标识信息查询词语位置索引模块,以获取所述检索关键词在所述文档标识信息对应的文档中的位置信息;
根据所述文档标识信息及所述位置信息显示所述文档。
2.根据权利要求1所述的数据检索方法,其特征在于,所述检索关键词对应的词语标识信息为所述反向索引模块中用于存储与所述检索关键词相关的文档信息的起始位置。
3.根据权利要求1或2所述的数据检索方法,其特征在于,对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息的步骤之后还包括:从所述文档信息中获取所述检索关键词在各所述文档中出现的次数;相应地,根据所述文档标识信息及所述位置信息显示所述文档的步骤中还包括显示所述检索关键词在所述文档中出现的次数。
4.根据权利要求1或2所述的数据检索方法,其特征在于,所述获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以从所述词语索引模块中预置的与所述检索关键词对应的词语标识信息的步骤之前,还包括:
在词语索引模块中预置词语列表,所述词语列表包括多个词语及与所述词语对应的所述词语标识信息;
在反向索引模块中预置与所述词语标识信息对应的文档标识信息;
对所述文档标识信息进行压缩。
5.根据权利要求4所述的数据检索方法,其特征在于,对所述文档信息进行压缩的步骤具体包括:
利用2比特位来表示所述文档标识信息所占用的字节数,并将对应于各所述词语的连续四个文档标识信息所占用的字节数组合在一个用于存储字节数信息的字节中;
删除所述四个文档标识信息中所占用的内容为0的字节、并连续存储内容不为0的字节。
6.根据权利要求5所述的数据检索方法,其特征在于,对所述文档信息进行解压缩的步骤具体包括:
对所述用于存储字节数信息的字节进行位运算,以获取所述连续四个文档标识信息所占用的字节数,并根据所述字节数从所述连续存储的内容不为0的字节中读取所述连续四个文档标识信息。
7.一种数据检索装置,其特征在于,包括获取模块、词语索引模块、反向索引模块、词语位置索引模块和显示模块,其中:
所述获取模块与所述词语索引模块、反向索引模块、词语位置索引模块和显示模块连接,用于获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以获取所述词语索引模块中预置的与所述检索关键词对应的词语标识信息;
根据所述词语标识信息查询反向索引模块,以获取所述反向索引模块中预置的与所述词语标识信息对应的压缩存储的文档信息;
对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
根据所述检索关键词和所述文档标识信息查询词语位置索引模块,以获取所述检索关键词在所述文档标识信息对应的文档中的位置信息;
将对应于所述文档标识信息的所述文档及所述信息参数发送给所述显示模块,以根据所述文档标识信息及所述位置信息显示所述文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛普加智能信息有限公司,未经青岛普加智能信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010588551.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置