[发明专利]一种用于基于用户的需求进行搜索的方法和设备无效

申请号：	201010187091.6	申请日：	2010-05-31
公开（公告）号：	CN102063453A	公开（公告）日：	2011-05-18
发明（设计）人：	孙云丰;金海燕;张玉睿;徐波;李明	申请（专利权）人：	百度在线网络技术(北京)有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京汉昊知识产权代理事务所(普通合伙) 11370	代理人：	罗朋
地址：	100085 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于基于用户需求进行搜索方法设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及网络技术领域，尤其涉及基于用户的需求进行搜索的技术。

背景技术

自从70、80年代互联网普及以来，为满足用户在互联网上访问海量信息的要求，出现了许多网络搜索技术，我们简单回顾如下：

90年代早期出现基于人工信息分类的EINet Galaxy搜索引擎。随后与19994年Lycos搜索引擎推出，其包括基于机器人程序(Robot)的数据挖掘技术和支持搜索结果相关性排序。

1995年的AltaVista推出的搜索引擎第一个支持自然语言搜索的搜索引擎，具备了基于网页内容分析，智能处理的能力，第一个实现高级搜索语法的搜索引擎(如AND、OR、NOT等)。

1997年，Northernlight公司推出的搜索引擎第一个支持对搜索结果进行简单的自动分类，也是当时拥有最大数据库的搜索引擎之一。

1998年，Google推出基于其PAGERANK算法的搜索引擎，其根据网页之间相互的超链接计算的网页排序。

2000年，百度创始人李彦宏推出基于超链分析的百度搜索引擎。

现有的搜索引擎的基本工作原理如下：

1)自动搜集信息：搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页链到其中的超链接，就象日常生活中所说的“一传十，十传百......”一样，从少数几个网页开始，连到数据库上所有到其他网页的链接。理论上，若网页上有适当的超链接，机器人便可以遍历绝大部分网页。

2)建立索引库：搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息，还要将它们按照一定的规则进行编排并保存于索引库中。这样，搜索引擎可以根据查询信息在索引库中迅速找到所要的资料。

3)接受查询：用户向搜索引擎发出查询，搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询，它按照每个用户的要求检查自己的索引，在极短时间内找到用户需要的资料，并将搜索结果返回给用户，其中搜索结果一般包括网页链接及摘要描述。在有多个搜索结果的情形下，需要利用各种算法进行排序，其中，最著名的搜索排序算法为Google的PageRank算法(参见美国专利US6285999)，其原理是根据网页之间相互的超链接计算进行网页排序，搜索引擎把从A网页到B网页的链接解释为A网页给B网页投票，并根据投票来源(甚至来源的来源，即链接到A网页的网页)和投票目标的等级来决定新的等级。简单的说，一个高等级的网页可以使被其链接或引用的其他低等级网页的等级提升。

其中，整理信息及接受查询的过程，大量应用了文本信息检索技术，并根据网络超文本的特点，引入了更多的信息。

对于文本信息检索，早期的信息检索系统采用“布尔查询”的方法来进行全文检索。用户必须详细的规划自己的查询，其复杂程度不亚于编程语言。这种检索方式并不提供任何的文档相关性测度，对于文档与查询的评价就只有“匹配”，“不匹配”两种而已。这两点问题决定了布尔查询不能被广泛应用。

对于大规模的语料库，任何检索都可能返回数量众多的结果，因此对检索结果进行排序是必须的。因此，一个好的信息检索模型必须提供文档相关性测度。一个好的测度应该使与用户查询需求最相关的那些结果，排在最前面，同时允许尽可能多的，与用户查询有一定关系的结果被包括进来。目前，最为常用的信息检索模型有三种：

I向量空间模型(Vector Space Model，VSM)

II概率模型(Probabilistic Model)

III推理网络模型(Inference Network Model)

简而言之，现有的搜索技术基本上均基于用户查询请求信息中所含关键词对索引库进行匹配搜索，根据匹配度或相似度获得多个搜索结果并根据点击率或超链信息进行筛选或排序，也即仅根据一些外在的、或客观信息来进行搜索，因此不能在搜索结果中反映用户的实际需求。

发明内容

本发明的目的是为克服现有技术的缺陷，提供一种基于用户需求进行搜索的方法和设备。

根据本发明的一个方面，还提供了一种用于基于用户的需求进行搜索的方法，该方法包括以下步骤：

a获取该用户的查询请求；

b根据所述查询请求进行匹配搜索，以获得与所述查询请求和用户需求相匹配的一个或多个搜索选项；