[发明专利]基于倒排表进行检索提示的方法无效

专利信息
申请号: 200610112822.4 申请日: 2006-09-04
公开(公告)号: CN1916905A 公开(公告)日: 2007-02-21
发明(设计)人: 曹勇刚;曹羽中;金茂忠;刘超 申请(专利权)人: 北京航空航天大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京北新智诚知识产权代理有限公司 代理人: 张卫华
地址: 100083*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明是一种基于倒排表进行检索提示的方法,它包括如下步骤:建立主搜索引擎使用的主倒排表和次搜索引擎使用的次倒排表;将用户输入的检索串切分成词,用主搜索引擎检索出包含这些词的文档,并将这些文档进行相关度排序,得到检索结果。再将检索串切分成字,用次搜索引擎检索出包含检索串中每一个字的词,再对所有检索出的词汇进行优先度排序,得到排序后的检出词序列;向用户提供检索提示时,按照从次搜索引擎中检索出的检出词序列的顺序显示每个检出词,并在每个检出词后面显示出包含这个检出词的文档数目。本发明基于待检索文档的内容来进行检索提示,它较基于查询词统计的检索提示有如下优点:可以把少见的、信息量大的词给提示出来;所提示的词冗余数量少,跨越范围大,能够给用户更加广度的提示;能提示出鲜为人知的检索词,并能列出每个检索提示词会在多少篇文档中出现,从而扩展用户的知识面,帮助用户进行更准确的检索。
搜索关键词: 基于 倒排表 进行 检索 提示 方法
【主权项】:
1.一种基于倒排表进行检索提示的方法,其特征在于它包括如下步骤:●建立主搜索引擎使用的主倒排表把全部待检索文档切分成词,对切分后的词进行索引,建立以词为索引、包含此词的文档编号列表为值的倒排表,称之为主倒排表。使用主倒排表对文档进行索引和检索的部分即为主搜索引擎,主搜索引擎用于根据查询串中的词检索包含该词的文档;●建立次搜索引擎使用的次倒排表把上一步骤中切分后的词再切分成字,对切分后的字进行索引,建立以字为索引、包含此字的词为值的倒排表,称之为次倒排表,使用次倒排表对词进行索引和检索的部分即为次搜索引擎,次搜索引擎用于根据查询串中的字检索包含该字的词;●用主搜索引擎检索文档将用户输入的检索串切分成词,用主搜索引擎检索出包含这些词的文档,再对所有检索出的文档进行相关度排序,得到排序后的检出文档序列;●用次搜索引擎检索词将用户输入的检索串切分成字,用次搜索引擎检索出包含检索串中每一个字的词,再对所有检索出的词进行优先度排序,得到排序后的检出词序列;●检索提示向用户提供检索提示时,按照从次搜索引擎中检索出的检出词序列的顺序显示每个检出词,并在每个检出词后面显示出包含这个词的文档数目。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200610112822.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top