[发明专利]一种网页搜索方法及装置在审
申请号: | 201911250600.2 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111143649A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 刘礼刚 | 申请(专利权)人: | 杭州迪普科技股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书提供一种网页搜索方法及装置,其中方法包括:所述方法包括:从待爬取队列中,取出父网页统一资源定位符URL;从所述父网页URL对应的父网页,解析出所述父网页中包含的子网页URL;根据所述子网页URL,获取对应的子网页;根据所述父网页的主题相关度和所述子网页的网页标题相关度,确定所述子网页的主题相关度;若所述子网页的主题相关度大于或等于预设的相关度阈值,保存所述子网页;同时,将所述子网页的URL加入所述待爬取队列。以提高主题相关度计算的准确性。 | ||
搜索关键词: | 一种 网页 搜索 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技股份有限公司,未经杭州迪普科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911250600.2/,转载请声明来源钻瓜专利网。
- 上一篇:放水堵防丢装置
- 下一篇:一种基于静态-动态注意力变分网络的对话生成方法