[发明专利]一种用于基于用户的需求进行搜索的方法和设备无效

专利信息
申请号: 201010187091.6 申请日: 2010-05-31
公开(公告)号: CN102063453A 公开(公告)日: 2011-05-18
发明(设计)人: 孙云丰;金海燕;张玉睿;徐波;李明 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人: 罗朋
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 基于 用户 需求 进行 搜索 方法 设备
【说明书】:

技术领域

本发明涉及网络技术领域,尤其涉及基于用户的需求进行搜索的技术。

背景技术

自从70、80年代互联网普及以来,为满足用户在互联网上访问海量信息的要求,出现了许多网络搜索技术,我们简单回顾如下:

90年代早期出现基于人工信息分类的EINet Galaxy搜索引擎。随后与19994年Lycos搜索引擎推出,其包括基于机器人程序(Robot)的数据挖掘技术和支持搜索结果相关性排序。

1995年的AltaVista推出的搜索引擎第一个支持自然语言搜索的搜索引擎,具备了基于网页内容分析,智能处理的能力,第一个实现高级搜索语法的搜索引擎(如AND、OR、NOT等)。

1997年,Northernlight公司推出的搜索引擎第一个支持对搜索结果进行简单的自动分类,也是当时拥有最大数据库的搜索引擎之一。

1998年,Google推出基于其PAGERANK算法的搜索引擎,其根据网页之间相互的超链接计算的网页排序。

2000年,百度创始人李彦宏推出基于超链分析的百度搜索引擎。

现有的搜索引擎的基本工作原理如下:

1)自动搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页链到其中的超链接,就象日常生活中所说的“一传十,十传百......”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。

2)建立索引库:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排并保存于索引库中。这样,搜索引擎可以根据查询信息在索引库中迅速找到所要的资料。

3)接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并将搜索结果返回给用户,其中搜索结果一般包括网页链接及摘要描述。在有多个搜索结果的情形下,需要利用各种算法进行排序,其中,最著名的搜索排序算法为Google的PageRank算法(参见美国专利US6285999),其原理是根据网页之间相互的超链接计算进行网页排序,搜索引擎把从A网页到B网页的链接解释为A网页给B网页投票,并根据投票来源(甚至来源的来源,即链接到A网页的网页)和投票目标的等级来决定新的等级。简单的说,一个高等级的网页可以使被其链接或引用的其他低等级网页的等级提升。

其中,整理信息及接受查询的过程,大量应用了文本信息检索技术,并根据网络超文本的特点,引入了更多的信息。

对于文本信息检索,早期的信息检索系统采用“布尔查询”的方法来进行全文检索。用户必须详细的规划自己的查询,其复杂程度不亚于编程语言。这种检索方式并不提供任何的文档相关性测度,对于文档与查询的评价就只有“匹配”,“不匹配”两种而已。这两点问题决定了布尔查询不能被广泛应用。

对于大规模的语料库,任何检索都可能返回数量众多的结果,因此对检索结果进行排序是必须的。因此,一个好的信息检索模型必须提供文档相关性测度。一个好的测度应该使与用户查询需求最相关的那些结果,排在最前面,同时允许尽可能多的,与用户查询有一定关系的结果被包括进来。目前,最为常用的信息检索模型有三种:

I向量空间模型(Vector Space Model,VSM)

II概率模型(Probabilistic Model)

III推理网络模型(Inference Network Model)

简而言之,现有的搜索技术基本上均基于用户查询请求信息中所含关键词对索引库进行匹配搜索,根据匹配度或相似度获得多个搜索结果并根据点击率或超链信息进行筛选或排序,也即仅根据一些外在的、或客观信息来进行搜索,因此不能在搜索结果中反映用户的实际需求。

发明内容

本发明的目的是为克服现有技术的缺陷,提供一种基于用户需求进行搜索的方法和设备。

根据本发明的一个方面,还提供了一种用于基于用户的需求进行搜索的方法,该方法包括以下步骤:

a获取该用户的查询请求;

b根据所述查询请求进行匹配搜索,以获得与所述查询请求和用户需求相匹配的一个或多个搜索选项;

c将所述一个或多个搜索选项提供给所述用户,供其选择。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010187091.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top