[发明专利]一种搜索结果一致性的检查方法及装置有效
申请号: | 201910278487.2 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110119471B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 龙四亮;许静芳 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/955;G06F11/30 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 结果 一致性 检查 方法 装置 | ||
本发明公开了一种搜索结果一致性的检查方法,包括:获得查询词对应的搜索结果页,所述搜索结果页来自于服务器对所述查询词的搜索;对所述搜索结果页中的搜索结果项进行筛选,基于筛选后的搜索结果项获得仅包含目标搜索结果项的特定搜索结果页截图;所述目标搜索结果项为进行一致性检查时指定检查的搜索结果项;基于所述特定搜索结果页截图,进行搜索结果一致性的检查。本发明实现了提高搜索结果一致性的检查准确率的技术效果。同时,本发明还公开了一种搜索结果一致性的检查装置。
技术领域
本发明涉及搜索技术领域,尤其涉及一种搜索结果一致性的检查方法及装置。
背景技术
随着搜索技术的飞速发展,搜索功能越来越强大,可以提供新闻、网页、图片、微信、音乐、视频、地图、购物、学术、医疗等全方位的搜索服务,深受广大用户的喜爱。并且,使用搜索服务的用户数以亿计,一台服务器早已不能满足搜索业务的需求,现如今,都是采用多台服务器向用户提供搜索服务。
多台服务器同时工作,难免出现搜索逻辑不一致的情况(即:多台服务器同时对同一查询词进行搜索,而得到的搜索结果却不一致),其中,有些是人为设计(例如:出于个性化考虑,为不同地区的用户提供差异化的搜索结果),而有些却是缺陷。因此,有必要对这些服务器进行搜索结果一致性的检查,从而使得技术人员了解服务器的状态。
但是,目前在对搜索结果一致性进行检查时,准确率不高,难以为技术人员提供有价值的检查结果。
发明内容
本发明实施例通过提供一种搜索结果一致性的检查方法及装置,能够提高搜索结果一致性检查的准确率。
第一方面,本发明通过本发明的一实施例提供如下技术方案:
一种搜索结果一致性的检查方法,包括:
获得查询词对应的搜索结果页,所述搜索结果页来自于服务器对所述查询词的搜索;
对所述搜索结果页中的搜索结果项进行筛选,基于筛选后的搜索结果项获得仅包含目标搜索结果项的特定搜索结果页截图;所述目标搜索结果项为进行一致性检查时指定检查的搜索结果项;
基于所述特定搜索结果页截图,进行搜索结果一致性的检查。
优选地,所述获得查询词对应的搜索结果页,包括:
获取所述查询词对应的查询请求统一资源定位符URL;
将所述查询请求URL发送给所述服务器,并接收所述服务器反馈的所述搜索结果页。
优选地,所述对所述搜索结果页中的搜索结果项进行筛选,基于筛选后的搜索结果项获得仅包含目标搜索结果项的特定搜索结果页截图,包括:
获取所述目标搜索结果项的特征信息;
基于所述特征信息,在所述搜索结果页中找出不属于所述目标搜索结果项的干扰搜索结果项;
将所述搜索结果页中的所述干扰搜索结果项进行隐藏;
对隐藏所述干扰搜索结果项后的搜索结果页进行截图,获得所述特定搜索结果页截图。
优选地,所述将所述搜索结果页中的所述干扰搜索结果项进行隐藏,包括:
从所述搜索结果页中删除所述干扰搜索结果项对应的超文本标记语言html代码。
优选地,所述对所述搜索结果页中的搜索结果项进行筛选,基于筛选后的搜索结果项获得仅包含目标搜索结果项的特定搜索结果页截图,包括:
对所述搜索结果页进行截图,获得搜索结果页截图;
获取所述目标搜索结果项的特征信息;
基于所述特征信息,在所述搜索结果页中找出所述目标搜索结果项;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910278487.2/2.html,转载请声明来源钻瓜专利网。