[发明专利]一种确定网络资源点的抓取频率的装置和方法有效
申请号: | 201310495856.6 | 申请日: | 2013-10-21 |
公开(公告)号: | CN103577557B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 孙林;陈培军;秦吉胜 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市隆安律师事务所11323 | 代理人: | 权鲜枝 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种确定网络资源点的抓取频率的装置和方法,用于确定网络资源点的抓取频率以提高搜索质量,该方法包括如下步骤由网络资源点抓取多个待分析问答对;根据包括多条问答知识记录的问答知识库,获取每个待分析问答对的相关联程度;根据所述待分析问答对的相关联程度确定所述网络资源点的抓取频率。使用本发明的装置和方法,可以通过评价网络资源点的问答对的质量而评价网络资源点的质量,进而根据网络资源点的质量确定抓取频率,可以提高搜索的质量。 | ||
搜索关键词: | 一种 确定 网络资源 抓取 频率 装置 方法 | ||
【主权项】:
一种确定网络资源点的抓取频率的装置,该装置包括:问答知识库,适于存储多条问答知识记录;资源分析单元,适于由网络资源点抓取多个待分析问答对;相关联程度计算单元,适于根据问答知识库获取每个待分析问答对的相关联程度;抓取频率确定单元,根据所述待分析问答对的相关联程度确定所述网络资源点的抓取频率;该装置还包括问答知识库构建单元,所述问答知识库构建单元,适于预先从含有问答对的网页提取出多个问答对,根据提取的问答对构建包括多条问答知识记录的问答知识库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310495856.6/,转载请声明来源钻瓜专利网。