[发明专利]对包括手机号码的查询词进行搜索的方法和装置有效
申请号: | 201510380046.5 | 申请日: | 2015-07-01 |
公开(公告)号: | CN104933180B | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 王翀 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市立方律师事务所11330 | 代理人: | 张筱宁 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 手机号码 查询 进行 搜索 方法 装置 | ||
1.一种对包括手机号码的查询词进行搜索的方法,其特征在于,包括:
通过搜索引擎爬虫爬取多个待检测页面;
检测多个待检测页面中的任一项指向的页面中包括的手机号码数量与预定第二总号码数量阈值的大小关系;
当检测到任一待检测页面指向的页面中包括的手机号码数量超过预定第二总号码数量阈值,确定该待检测页面为预定降权页面;
接收用户在搜索框输入的包括手机号码的查询词;
根据包括手机号码的查询词进行搜索,获取与该查询词相匹配的多个搜索结果项;
检测所述多个搜索结果项中是否存在符合预定降权规则的搜索结果项,当检测到所述多个搜索结果项中的任一项指向的页面中包括在所述手机号码之前及之后连续排列的其他手机号码数量超过预定连续号码数量阈值,其中,所述手机号码与其他手机号码两两之间仅通过空格符间隔连续排列,确定该搜索结果项符合预定降权规则;
或当检测到所述多个搜索结果项中的任一项指向的页面中包括的手机号码数量超过预定第一总号码数量阈值,确定该搜索结果项符合预定降权规则;
或当检测到所述多个搜索结果项中的任一项指向的页面属于预定降权页面时,确定该搜索结果项符合预定降权规则;
对符合所述预定降权规则的搜索结果项进行降权处理,并基于降权结果对所述多个搜索结果项进行排序;
生成包含排序后的搜索结果项的搜索结果页。
2.一种对包括手机号码的查询词进行搜索的装置,其特征在于,包括:
爬取模块,用于通过搜索引擎爬虫爬取多个待检测页面;
预检测模块,用于检测多个待检测页面中的任一项指向的页面中包括的手机号码数量与预定第二总号码数量阈值的大小关系;
降权页面确定模块,用于当检测到任一待检测页面指向的页面中包括的手机号码数量超过预定第二总号码数量阈值,确定该待检测页面为预定降权页面;
接收模块,用于接收用户在搜索框输入的包括手机号码的查询词;
搜索模块,用于根据包括手机号码的查询词进行搜索,获取与该查询词相匹配的多个搜索结果项;
检测模块,用于检测所述多个搜索结果项中是否存在符合预定降权规则的搜索结果项,当检测到所述多个搜索结果项中的任一项指向的页面中包括在所述手机号码之前及之后连续排列的其他手机号码数量超过预定连续号码数量阈值,其中,所述手机号码与其他手机号码两两之间仅通过空格符间隔连续排列,确定该搜索结果项符合预定降权规则;或当检测到所述多个搜索结果项中的任一项指向的页面中包括的手机号码数量超过预定第一总号码数量阈值,确定该搜索结果项符合预定降权规则;或当检测到所述多个搜索结果项中的任一项指向的页面属于预定降权页面时,确定该搜索结果项符合预定降权规则;
降权排序模块,用于对符合所述预定降权规则的搜索结果项进行降权处理,并基于降权结果对所述多个搜索结果项进行排序;
生成模块,用于生成包含排序后的搜索结果项的搜索结果页。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510380046.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种燃油催化功能材料及其制备方法
- 下一篇:一种长杆喷枪喷涂支架