[发明专利]搜索方法及搜索系统有效
申请号: | 200910038647.2 | 申请日: | 2009-04-15 |
公开(公告)号: | CN101526951A | 公开(公告)日: | 2009-09-09 |
发明(设计)人: | 王顼 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司 | 代理人: | 曾旻辉 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 方法 系统 | ||
【技术领域】
本发明涉及计算机技术领域,尤其是一种搜索方法及搜索系统。
【背景技术】
计算机网络技术的发展极大的提高了人们获取信息的便利性。计算机网络中存储了海量的信息,为了便于人们查找到自己所需的信息,搜索引擎被广泛使用。人们通过输入关键词,即可找到包含该关键词的网页。
然而,正由于计算机网络中数据量非常庞大,通过搜索引擎搜索获得的满足条件的搜索结果通常也是非常多,有时甚至多达数百万,这其中就有相当一部分网页虽然包含用户输入的关键词,但是与用户所要了解的信息无关。例如,当用户搜索“三亚景点”的时候,目的是为了搜索“旅游”这个主题的内容,但是涉及到“三亚”“景点”这两个关键字的站点/网页也有很多是和“旅游”无关的,这些无关的网页将浪费用户的时间并分散用户的精力。那么如果返回的结果的站点/网页都和“旅游”相关的话,就可以很好的提高用户体验。
为了解决上述问题,一般的搜索引擎都提供了限制关键词的位置(例如限制关键词在网页的标题中、在网页的URL中、在某些指定的网站中)进行搜索。虽然这种方式可以提高搜索结果内容的相关度,但是用户因此会将搜索的面限制得很窄,不利于用户获取更多有价值的信息。
【发明内容】
基于此,有必要提供一种根据用户的搜索主题进行搜索的搜索方法。
一种网络搜索方法,包括以下步骤:设置网页或网站的主题分值;接收限制主题的搜索请求;根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索;返回搜索结果。所述设置网页或网站的主题分值的步骤包括如下步骤:获取种子页面的主题分值;获取父页面的主题分值,最初的父页面为所述种子页面;计算子页面与主题及父页面的关联度,所述子页面与父页面的 关联度根据父页面的链接文字和子页面的标题的相关程度进行计算获得、或根据子页面与父页面的内容的相关程度进行计算获得,所述子页面与主题的关联度根据所述链接文字和子页面的标题、内容命中该主题下的核心词的词表中的词的数量计算获得;根据父页面的主题分值和所述关联度计算子页面的主题分值。
优选地,所述设置网页或网站的主题分值的步骤还包括如下步骤:计算网站的主题分值;将所述网页的主题分值及网站的主题分值作为搜索索引的一部分。
优选地,所述计算子页面的主题分值还包括判断迭代次数是否超过预定值的步骤,如果未超过所述预定值,则重复执行所述获取父页面的主题分值;计算子页面与主题及父页面的关联度;根据父页面的主题分值和关联度计算子页面的主题分值的步骤。
优选地,所述计算网站的主题分值包括如下步骤:统计网站各网页的主题分值;将主题分值之和或者网站各网页的平均主题分值作为所述网站的主题分值。
此外,还有必要提供一种根据用户的搜索主题进行搜索的搜索系统。
一种网络搜索系统,包括:输入模块,用于接收限制主题的搜索请求;主题分值模块,用于设置网页或网站的主题分值;索引模块,与所述主题分值模块相连,用于存储所述主题分值的信息;搜索模块,与所述输入模块及索引模块相连,根据所述搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索;输出模块,用于输出搜索结果。所述主题分值模块包括:种子页面设定单元,用于选定种子页面及设定种子页面的主题分值;页面关系追踪单元,与所述种子页面设定单元相连,追踪与所述种子页面链接的网页;关联度计算单元,与所述页面关系追踪单元相连,根据所述页面关系追踪单元获得的网页计算子页面与主题及父页面的关联度,所述子页面与父页面的关联度根据父页面的链接文字和子页面的标题的相关程度进行计算获得、或根据子页面与父页面的内容的相关程度进行计算获得,所述子页面与主题的关联度根据所述链接 文字和子页面的标题、内容命中该主题下的核心词的词表中的词的数量计算获得;主题分值计算单元,与所述关联度计算单元相连,根据父页面的主题分值和所述关联度计算子页面的主题分值。
优选地,所述主题分值计算单元还用于统计网站各网页的主题分值;将主题分值之和或者网站各网页的平均主题分值作为所述网站的主题分值。
上述搜索方法通过设置网页或网站的主题分值,在接收到用户限制主题的搜索请求时,根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索并返回搜索结果,使得获得的搜索结果与用户所需的主题密切相关,使用户快速、方便地获得所需的搜索结果。
【附图说明】
图1为搜索方法的流程图;
图2为设置网页或网站的主题分值的详细流程图;
图3为计算子页面的主题分值的详细流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910038647.2/2.html,转载请声明来源钻瓜专利网。