[发明专利]用于分类呈现搜索结果的方法和系统有效

专利信息
申请号: 200680003954.1 申请日: 2006-02-02
公开(公告)号: CN101116072A 公开(公告)日: 2008-01-30
发明(设计)人: 西蒙·詹姆斯·凯斯;贝南·阿斯文;崔湛 申请(专利权)人: 英国电讯有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京三友知识产权代理有限公司 代理人: 李辉
地址: 英国*** 国省代码: 英国;GB
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 分类 呈现 搜索 结果 方法 系统
【说明书】:

技术领域

本发明涉及文档搜索工具和方法。具体地说,本发明涉及旨在用于对存储有大量电子文档的大型电子数据库进行搜索的电子文档搜索工具和方法。

背景技术

存在日益增加的大量的电子地存储的信息。另外,存在针对使得不同数据库的数据为临时搜索者可用的增长的趋势。例如,因为越来越多的数据被写入因特网服务器并且因为越来越多的组织将他们的数据库连接至因特网并由此使这些数据库中包含的信息可经由因特网使用,所以包括大量存储各种信息的不同服务器的因特网在持续扩大。

为了使得用户能够筛选这种大量信息并且在海量无关文档中寻找相关文档,信息技术界内花费了许多努力来研究并开发搜索方法和工具,以解决由此引发的、所谓的“数据超载信息贫乏”问题。

用于在因特网上寻找电子文档的多数搜索工具是基于关键字的搜索,并且这些搜索工具趋于针对包括一个或仅几个关键字(至少它们是相当普通的字)的任何合理普通查询,返回难于处理的大量命中(hit)。甚至更多采用了精细分类文档内容等的高级搜索工具因其基本上趋向于基于关键字的搜索工具,故而针对任何相当普通的查询仍然趋于返回大量“命中”。

这种问题的原因之一仅仅在于计算机能够非常快速地处理大量数据从而生成非常大的命中列表。将典型因特网搜索引擎的性能与人类图书管理员相比,针对诸如“Hercules”的简单查询来说,前者很可能生成数以万计的结果,而后者通常至多生成两个或三个“命中”。然而,在执行“搜索”之前,人类图书管理员将大概检查读者是否意指传说中的希腊英雄或是完全不同的内容(例如,具有该名称的商业组织,计算机程序,等等),并且人类图书管理员将几乎确定地寻找和读者相关的内容。

因此,清楚的是,因为人类图书管理员能够向请求搜索的人询问智能问题并由此排除整个文档“图书馆”中的仅仅基于简单关键字搜索而可能被分类为“命中”的大部分,所以他或她通常可以做得比因特网搜索引擎好。这种能力超出了当前计算机能够成功模仿的能力,因此,需要另选技术方案来在利用计算机的技术实力同时设法克服它们相应的弱点(具体地说,它们缺乏智能)的情况下使得计算机能够提高它们的搜索能力,或者更加精确地说,提高计算机辅助用户/请求者从利用基于简单关键字的搜索通常找到的大量可能文档中寻找和该用户/请求者特别相关或所关注的一个或两个文档的能力。

US专利No.6526440描述了一种根据返回文档被其它文档引用的频率对搜索结果进行重排序的系统。换句话说,这个文献描述了一种基于元信息(即,关于文档的信息)而非简单地依赖文档中包含的信息重排序文档的方法。

Vivisimo已经生产出一种称为“Clusty”的搜索引擎,该搜索引擎目前可从http://clusty.com上获得,在该搜索引擎中将任何特定搜索的结果聚类成相关类别。

由Amazon.com提交的WO 01/46870描述了如下一种系统,该系统用于将搜索结果放入对应类别(每一个结果都已被预指配给特定类别(例如,书、CD等)),并且用于根据多种规则(例如,通过计算特定类别中的结果数与该类别中的项数的比率并且根据关于各类别的该比率的值对多个类别进行排序)确定要向用户呈现不同类别的次序。

US 6385602描述了一种类似于上述Clusty搜索引擎的系统,在该系统中,在执行搜索之后,使所得结果聚类,并基于聚类动态类别对这些结果进行限定且用于将其呈现给用户。

US 2003/0088553描述了这样一种系统,即,在该系统中,第一数据库存储预定类别集,第二数据库存储一组“预期搜索项”和到一个或更多个预定类别的映射,而第三数据库存储类别与各种因特网网站之间的映射(即,将网站预分类到一个或更多个预定义类别)。接着,通过将输入搜索查询指配给一类别并接着检索与输入搜索查询对应的被预分类到相应类别的所有网站(或到这些网站的链接或标题)来进行搜索。要注意的是,这一活动代表了搜索处理的全部,由此,既没有阶段执行关键字类型搜索,接着也没有将这种搜索的结果分类到多个单独的类别,而搜索结果仅仅是分类为属于输入搜索查询匹配的哪个类别的网站的总和。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英国电讯有限公司,未经英国电讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680003954.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top