[发明专利]网络搜索处理方法、装置、电子设备有效
申请号: | 202010223119.0 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111444408B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 李辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F16/9538;G06F16/955;G06F16/957 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 搜索 处理 方法 装置 电子设备 | ||
本发明提供了一种网络搜索处理方法、装置、电子设备及计算机可读存储介质;方法包括:从网络中抓取内容并在搜索引擎的索引库中建立索引,其中所述索引包括抓取内容的关键字和链接;接收客户端针对访问内容的异常状态通知,并在所述索引库对应所述访问内容的索引中记录异常状态;接收搜索请求,并根据所述搜索请求携带的关键字查询所述索引库,得到与所述关键字匹配的多个内容所分别对应的链接;在所述多个内容中过滤掉被记录为异常状态的内容;基于过滤后的内容所分别对应的链接构造搜索结果,以响应所述搜索请求,通过本发明,能够优化异常内容的主动探测机制,以避免延时问题。
技术领域
本发明涉及网络技术,尤其涉及一种网络搜索处理方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,出现了各种各样的搜索引擎,通常搜索引擎接收用户发起的检索请求,搜索引擎会从存储有链接和链接对应的内容的快照缓存中检索包括关键字的第三方的内容,并将包括相关链接的快照内容呈现给用户。
由于这些内容大多数是位于互联网上的第三方站点,其发生更新时并不会主动通知搜索引擎,而搜索引擎检索为了加快检索速度,会结合快照的内容进行检索,因此不会实时感知第三方站点的链接的可访问性可能存在问题,通常情况下,第三方站点删除了相关内容或者调整了内容的链接,会导致搜索引擎返回给用户的链接不再有效,影响了用户的有效访问的搜索体验。
发明内容
本发明实施例提供一种网络搜索处理方法、装置、电子设备及计算机可读存储介质,能够优化异常内容的主动探测机制,以避免延时问题。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种网络搜索处理方法,包括:
从网络中抓取内容并在搜索引擎的索引库中建立索引,其中所述索引包括抓取内容的关键字和链接;
接收客户端针对访问内容的异常状态通知,并在所述索引库对应所述访问内容的索引中记录异常状态;
接收搜索请求,并根据所述搜索请求携带的关键字查询所述索引库,得到与所述关键字匹配的多个内容所分别对应的链接;
在所述多个内容中过滤掉被记录为异常状态的内容;
基于过滤后的内容所分别对应的链接构造搜索结果,以响应所述搜索请求。
本发明实施例提供一种网络搜索处理装置,所述装置包括:
索引建立模块,用于从网络中抓取内容并在搜索引擎的索引库中建立索引,其中所述索引包括抓取内容的关键字和链接;
状态记录模块,用于接收客户端针对访问内容的异常状态通知,并在所述索引库对应所述访问内容的索引中记录异常状态;
搜索查询模块,用于接收搜索请求,并根据所述搜索请求携带的关键字查询所述索引库,得到与所述关键字匹配的多个内容所分别对应的链接;
内容过滤模块,用于在所述多个内容中过滤掉被记录为异常状态的内容;
结果响应模块,用于基于过滤后的内容所分别对应的链接构造搜索结果,以响应所述搜索请求。
在上述方案中,所述状态记录模块,还用于:
针对所述访问内容的异常状态进行可靠性分析;
当所述访问内容的异常状态满足可靠性条件时,在所述索引库对应所述访问内容的索引中记录异常状态。
在上述方案中,所述状态记录模块,还用于:
在窗口时间中,记录针对所述访问内容接收到的异常状态通知的累计次数,其中,所述累计次数与所述异常状态的可靠性正相关;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010223119.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:负载均衡方法及装置
- 下一篇:输电线路故障预警方法及装置