[发明专利]一种搜索服务器及搜索方法在审
申请号: | 201210394965.4 | 申请日: | 2012-10-17 |
公开(公告)号: | CN102945253A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 张栋 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙) 11391 | 代理人: | 康正德;范晓斌 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 服务器 方法 | ||
技术领域
本发明涉及网络搜索领域,尤其涉及一种考虑到网络内容的下载可靠度的搜索服务器及相应的搜索方法。
背景技术
随着互联网的高速发展,各种企业、组织和个人等逐步了解到在互联网上提供信息服务的重要性而纷纷建立各自的网站来发布相应信息。随着在网络上提供网络信息服务的网站日益增多,互联网用户很难记住所有的这些网站甚至是想访问的网站的具体地址。与此同时,互联网所容纳的信息也在呈爆炸式增长,发展到今天,互联网上的各种内容,可谓是浩如烟海。在这种情况下,如何让互联网用户在最短的时间内找到并下载到自己想要的内容,譬如程序、音乐、视频、文件……成为了当务之急。于是,有别于开始的发布各种消息的网站,一类专事搜索的网站、服务器应运而生。而基于互联网的搜索网站以及衍生出的各种搜索方式,也极大的推动了互联网的发展。目前,互联网用户在很大程度上都依赖于搜索网站来查询这些自己需要的可供下载的内容。
一般而言,搜索网站利用搜索引擎来从互联网中提取各个网站的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录。按照搜索结果与查询条件相匹配的程度,给出搜索结果中每条相应记录的排名得分score,按照排名得分score的高低来排序并返回给用户。
然而,现在的搜索引擎并没有考虑搜索返回的可下载内容是否真正可以下载,而且即使这些内容可以下载,也没有向用户给出下载这些内容的网络速度和可靠性的任何启示。也就是说,利用现有的网络搜索引擎进行搜索后用户所看到的搜索结果列表,仅仅是按照搜索结果中每条相应记录的得分来排序,并不能确定上述列表中所给出的链接,哪些是可下载的,哪些是下载速度很快的……也很难选择应该从哪个链接来下载是最可靠的和快速的。
因此需要一种新的搜索服务器和方法,在搜索结果中重点考虑用户所要下载内容的可靠性和下载速度等。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索服务器和相应的搜索方法。
根据本发明的一个方面,提供了一种搜索服务器,该搜索服务器包括信息存储器、搜索处理器、下载可靠度存储器和搜索后处理器。信息存储器,适于存储从接入互联网的各网站中收集的网页信息,其中网页信息至少包括网页的内容及其URL。搜索处理器,适于接收从用户终端提交的搜索关键词,从信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,其中每个搜索结果项包括相应网页的URL及其排序得分R_score。下载可靠度存储器,适于存储一个或者多个网页的下载可靠度信息,每个网页的下载可靠度信息至少包括网页的URL和网页的下载可靠度DR_score。搜索后处理器,适于从搜索处理器获取搜索结果列表,根据搜索结果列表的每个搜索结果项中网页的URL从下载可靠度存储器获取相应网页的下载可靠度信息,根据网页的排序得分R_score和下载可靠度DR_score生成网页的新排序得分NR_score,并以新排序得分NR_score更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
可选地,在根据本发明的搜索服务器中,网页的下载可靠度信息包括网页的URL和网页在不同地理区域对应的下载可靠度DR_score;并且搜索后处理器还适于从搜索处理器获取用户终端IP地址,根据网页的URL和用户终端IP地址从下载可靠度存储器获取与该用户终端IP地址相对应的地理区域的下载可靠度DR_score。
可选地,在根据本发明的搜索服务器中,根据下述来计算新排序得分:
NR_score=DR_score*x+R_score*(1-x),
其中x是下载可靠度权重,在0-1之间,优选为0.7。
可选地,在根据本发明的搜索服务器中,其中当所获取的下载可靠度DR_score小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述下载可靠度DR_score对应的网页的搜索结果项。
可选地,在根据本发明的搜索服务器中,新搜索结果列表的搜索结果项还包括相应网页的下载可靠度DR_score。
可选地,在根据本发明的搜索服务器中,如果当搜索后处理器未能从下载可靠度存储器获得相应网页的下载可靠度DR_score信息,则搜索后处理器不计算所述网页的新排序得分NR_score且不更新搜索结果列表中的相应搜索结果项中的排序得分R_score。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210394965.4/2.html,转载请声明来源钻瓜专利网。