[发明专利]一种应用于搜索系统的数据淘汰方法和装置在审
申请号: | 201910247135.0 | 申请日: | 2019-03-29 |
公开(公告)号: | CN109918575A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 刘一平 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书提供一种应用于搜索系统的数据淘汰方法和装置,先记录每条业务数据的被访问情况,并基于被访问情况计算业务数据的活跃值。在进行数据淘汰时,同时参考数据活跃值和数据存在时间两个数据。相比于传统的按时间直接淘汰旧业务数据的策略,本方案可以使冷数据(不关心数据)尽早淘汰,热数据常驻系统,在系统空间有限的条件下,提高搜索命中率,避免频繁重新加载已淘汰数据造成的系统负载和延迟。 | ||
搜索关键词: | 淘汰 业务数据 方法和装置 搜索系统 参考数据 常驻系统 系统负载 系统空间 重新加载 传统的 冷数据 热数据 命中率 延迟 应用 搜索 访问 记录 | ||
【主权项】:
1.一种应用于搜索系统的数据淘汰方法,所述方法包括:获取业务数据的被访问信息,所述被访问信息至少包括业务数据的被访问时间信息,根据所述被访问信息计算并调整对应业务数据的活跃值;提取业务数据的时间字段,根据所述时间字段确定业务数据在搜索系统中的存在时长;利用预设的数据热度算法计算每条业务数据的热度分值,所述热度分值与业务数据的存在时长成反比,且与所述业务数据的活跃值成正比;将计算出业务数据的热度分值与预定义的淘汰阈值进行对比,将热度分值低于淘汰阈值的业务数据从搜索系统中删除。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910247135.0/,转载请声明来源钻瓜专利网。