[发明专利]搜索方法、服务器及系统在审
申请号: | 201210045606.8 | 申请日: | 2012-02-27 |
公开(公告)号: | CN103294693A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 胡汉强 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 方法 服务器 系统 | ||
技术领域
本发明涉及数据处理技术,尤其涉及一种搜索方法、服务器及系统,属于网络技术领域。
背景技术
搜索引擎技术已经发展了近20年,全球搜索引擎市场被goole、微软、雅虎等巨头瓜分,中国的搜索引擎市场百度占据70%的市场。目前这些搜索引擎例如通过爬虫技术爬取网页,将网页分词,在搜索引擎数据库建立起关键词到网页的倒排索引,当用户提交搜索关键字时,搜索引擎根据关键词的倒排索引检索出相关文档的列表,并按某种网页排序算法如PageRank算法或个性化的网页排序算法对结果网页进行排序,然后将排序后的结果文档返回给用户。
可以看出,目前的搜索引擎技术都是基于用户输入的关键字进行搜索,还没有能够将某篇文档或网页作为搜索条件的搜索技术,如何检索出输入文档的相关文档对于搜索引擎技术的发展具有极为重要的意义。
发明内容
针对现有技术中存在的缺陷,本发明实施例提供一种搜索方法、服务器及系统,用以实现以文档作为搜索条件的相关文档搜索。
根据本发明实施例的一方面,提供一种搜索方法,包括:
接收搜索目标文档;
提取所述搜索目标文档的至少一个主题关键词;
根据所述至少一个主题关键词进行相关文档搜索,获取所述搜索目标文档的至少一个相关文档;
返回所述至少一个相关文档。
根据本发明实施例的另一方面,还提供一种搜索服务器,包括:
搜索请求接收模块,用于接收搜索目标文档;
主题关键词提取模块,用于提取所述搜索目标文档的至少一个主题关键词;
相关文档搜索模块,用于根据所述至少一个主题关键词进行相关文档搜索,获取所述搜索目标文档的至少一个相关文档;
搜索结果返回模块,用于返回所述至少一个相关文档。
根据本发明实施例的再一方面,还提供一种搜索系统,包括本发明实施例的搜索服务器,以及与所述搜索服务器通信的搜索客户端,其中所述搜索客户端用于向所述搜索服务器发送搜索目标文档,以及接收所述搜索服务器返回的相关文档。
根据本发明实施例提供的搜索方法、服务器及系统,通过接收搜索目标文档,并对搜索目标文档进行主题关键词提取,实现了基于文档/网页作为搜索条件,以搜索某篇文档/网页的相关文档的方法。一方面,使得输入的搜索条件更加多样化,另一方面,能够直接搜索出某篇文档的相关文档,使搜索的信息相关性更强,相关的信息更全面,提高了搜索的有效性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为用于实现本发明实施例的搜索方法的搜索系统架构图;
图2为本发明实施例的搜索方法;
图3为本发明实施例的搜索服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为用于实现本发明实施例的搜索方法的搜索系统架构图。如图1所示,该搜索系统包括搜索客户端和搜索服务器。搜索客户端例如包括搜索请求发送模块和搜索结果接收模块,其中,搜索请求发送模块负责向搜索服务器发送搜索请求,该搜索请求以某篇文档/网页作为搜索条件,用于请求搜索与输入的文档/网页相关或相似的文档;搜索结果接收模块负责接收元搜索服务器返回的搜索结果,即与作为搜索条件的文档/网页相关或相似的文档/网页。搜索服务器负责接收搜索客户端发送的以某个文档/网页为搜索条件的搜索请求,根据输入文档/网页提取一个或多个主题关键词,根据主题关键词发起网页搜索,获得搜索结果网页列表,并将搜索结果网页返回给搜索客户端。下面从搜索服务器的角度对本发明实施例的搜索方法进行说明。
图2为本发明实施例的搜索方法,如图2所示,该搜索方法包括以下步骤:
步骤S201,接收搜索目标文档;
步骤S202,提取所述搜索目标文档的至少一个主题关键词;
步骤S203,根据所述至少一个主题关键词进行相关文档搜索,获取所述搜索目标文档的至少一个相关文档;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210045606.8/2.html,转载请声明来源钻瓜专利网。