[发明专利]一种搜索词白名单的扩展方法及相关系统有效
申请号: | 201410370143.1 | 申请日: | 2014-07-30 |
公开(公告)号: | CN105335408B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 刘庆;周文军;黄华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索词 名单 扩展 方法 相关 系统 | ||
本申请提供了一种搜索词白名单的扩展方法及相关系统,所述方法包括:第一搜索系统接收搜索请求;从搜索请求中获取待搜索词;判断待搜索词是否在搜索词白名单中,如果否,计算待搜索词的属性值;判断待搜索词的属性值是否大于预设阈值,如果是,将待搜索词加入搜索词白名单中;搜索词白名单用于限制来源于第二搜索系统中且在第一搜索系统中搜索的可用搜索词的范围。可见,本申请无需根据系统日志的离线数据去扩展搜索词白名单,而是第一搜索系统每接收到一次搜索请求,都会去判断是否需要扩展搜索词白名单,如果是,则实现对搜索词白名单的扩展,实现了时效性较高地对搜索词白名单进行扩展。大大提升了用户体验,减少了第一搜索引擎的流量流失。
技术领域
本申请涉及计算机领域,尤其是涉及一种搜索词白名单的扩展方法及相关系统。
背景技术
搜索引擎是一种常用的搜索系统,通过搜索引擎等搜索系统的搜索过程,能够为用户提供信息检索服务。以搜索系统为搜索引擎A为例,具体的搜索过程包括:搜索引擎A接收到用户的搜索请求后,根据该请求中包含的待搜索词,搜索出与待搜索词相匹配的搜索结果。
而当搜索引擎A在接收到其他的搜索引擎,比如搜索引擎B发送的搜索请求时,则在进行搜索之前,还需要对搜索请求中的待搜索词进行搜索词白名单的过滤,具体过滤过程是:判断搜索请求中的待搜索词是否在搜索词白名单中,如果否,则显示搜索结果为零。这是因为若不设置搜索词白名单而直接对待搜索词进行搜索,则很有可能使得搜索结果与待搜索词的相关性较差,而搜索引擎B会收录该相关性较差的搜索结果,并因此降低搜索引擎A 在搜索引擎B的搜索结果排序。
目前在扩展搜索词白名单时,一般采用的是分析系统日志的方式,也就是每隔一段时间,通过系统日志的离线数据分析用户输入的待搜索词,从而判断是否添加到搜索词白名单中。显然在这种方式中,由于每隔一段时间才扩展一次搜索词白名单,因此时效性很差,即使在一段时间内某个待搜索词的搜索热度很高,也很有可能会使得用户无法通过搜索引擎A转入到搜索引擎B中实现对该待搜索词的搜索,造成搜索引擎A的流量流失以及用户体验较差。
需要说明的是,上面仅以搜索系统为搜索引擎为例加以说明,对于其余的搜索系统,同样存在上述问题。
发明内容
本申请解决的技术问题在于提供一种搜索词白名单的扩展方法及装置,以实现时效性较高的对搜索词白名单进行扩展,因此减少搜索系统的流量流失,提升用户体验。
为此,本申请解决技术问题的技术方案是:
本申请提供了一种搜索词白名单的扩展方法,包括:
第一搜索系统接收搜索请求;所述搜索请求用于指示在所述第一搜索系统中搜索与待搜索词相关的信息;
所述第一搜索系统从所述搜索请求中获取所述待搜索词;
所述第一搜索系统判断所述待搜索词是否在搜索词白名单中,如果否,计算所述待搜索词的属性值;
所述第一搜索系统判断所述待搜索词的属性值是否大于预设阈值,如果是,将所述待搜索词加入所述搜索词白名单中;
其中,所述搜索词白名单用于限制来源于第二搜索系统中且在所述第一搜索系统中搜索的可用搜索词的范围。
可选的,所述第一搜索系统从所述搜索请求中获取所述待搜索词之前还包括:
所述第一搜索系统判断所述搜索请求是否来源于所述第二搜索系统,如果是,才执行所述从所述搜索请求中获取所述待搜索词。
可选的,还包括:
若判断所述待搜索词是否在搜索词白名单的判断结果为否,返回默认搜索页面;所述默认搜索页面表示搜索结果为零。
可选的,所述待搜索词的属性值基于以下参数中的至少一项计算得到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410370143.1/2.html,转载请声明来源钻瓜专利网。