[发明专利]一种搜索服务器及搜索方法无效
申请号: | 201210395000.7 | 申请日: | 2012-10-17 |
公开(公告)号: | CN102937974A | 公开(公告)日: | 2013-02-20 |
发明(设计)人: | 张栋 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/52 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙) 11391 | 代理人: | 康正德;范晓斌 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 服务器 方法 | ||
技术领域
本发明涉及网络搜索领域,尤其涉及一种考虑到网络内容的信息安全度的搜索服务器及相应的搜索方法。
背景技术
随着互联网的高速发展,各种企业、组织和个人等逐步了解到在互联网上提供信息服务的重要性而纷纷建立各自的网站来发布相应信息。随着在网络上提供网络信息服务的网站日益增多,互联网用户很难记住所有的这些网站甚至是想访问的网站的具体地址。与此同时,互联网所容纳的信息也在呈爆炸式增长,发展到今天,互联网上的各种内容,可谓是浩如烟海。在这种情况下,如何让互联网用户在最短的时间内找到自己想要的内容成为了当务之急。于是,有别于开始的发布各种消息的网站,一类专事搜索的网站、服务器应运而生。而基于互联网的搜索网站以及衍生出的各种搜索方式,也极大的推动了互联网的发展。目前,互联网用户在很大程度上都依赖于搜索网站来查询这些自己需要的内容。
一般而言,搜索网站利用搜索引擎来从互联网中提取各个网站的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录。按照搜索结果与查询条件相匹配的程度,给出搜索结果中每条相应记录的排名得分score,按照排名得分score的高低来排序并返回给用户。
然而,随着互联网的快速发展,互联网上的信息呈爆炸式增长,各种不良和不正确的信息也越来越多。用户通过搜索网站进行查询时,经常会获得不正确、错误和恶意的信息。一些恶意人员故意构造带有木马、病毒等网页,利用搜索引擎的排名算法缺陷,使这些恶意网页在搜索结果中排名靠前。用户一旦通过搜索引擎搜索到这样的网页并选择浏览这些恶意网页,则很可能会因此使得用户的终端感染木马或者中毒并因此造成损失。另外一些恶意人员会构造类似于真实网站的虚假网站,并且利用搜索引擎的缺陷而在用户进行搜索时,在搜索结果中将虚假网站排名在真实网站之前,这样很可能引导用户前往这些虚假网站而使用户被虚假网站误导而遭受损失。
现有一些搜索引擎会在搜索结果中提醒用户相应的网页可能包含诸如木马、病毒的恶意内容,从而可以阻止用户访问这些网页。然而,现有的搜索引擎仅仅对恶意内容进行甄别,而没有对包含虚假内容的网页进行甄别,不能满足用户的真实需求。
因此,用户如何通过搜索引擎获得准确和安全的信息成为目前的重要挑战。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索服务器和相应的搜索方法。
根据本发明的一个方面,提供了一种搜索服务器,该搜索服务器包括信息存储器、搜索处理器、信息安全度存储器和搜索后处理器。信息存储器,适于存储从接入互联网的各网站中收集的网页信息,其中网页信息至少包括网页的内容及其URL。搜索处理器,适于接收从用户终端提交的搜索关键词,从信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,其中每个搜索结果项包括相应网页的URL及其排序得分R_score。信息安全度存储器,适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和网页的信息安全度IS_score。搜索后处理器,适于从搜索处理器获取搜索结果列表,根据搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据网页的排序得分R_score和信息安全度IS_score生成网页的新排序得分NR_score,并以新排序得分NR_score更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
可选地,在根据本发明的搜索服务器中,根据下述来计算新排序得分:
NR_score=IS_score*x+R_score*(1-x),
其中x是信息安全度权重,在0-1之间,优选为0.7。
可选地,在根据本发明的搜索服务器中,其中当所获取的信息安全度IS_score小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。特别地,如果本发明所述的信息安全度IS_score取值在1-100之间,当上述所获取的信息安全度IS_score小于30时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。
可选地,在根据本发明的搜索服务器中,新搜索结果列表的搜索结果项还包括相应网页的信息安全度IS_score。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210395000.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:个性化网址导航系统
- 下一篇:虚拟机调度方法和设备