[发明专利]标签数据存储方法、计算机装置和存储介质在审

专利信息
申请号: 202011171236.3 申请日: 2020-10-28
公开(公告)号: CN112347101A 公开(公告)日: 2021-02-09
发明(设计)人: 王宏军;郑坚财;徐永潮;蒙赞龙 申请(专利权)人: 北京北明数科信息技术有限公司
主分类号: G06F16/22 分类号: G06F16/22
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 常柯阳
地址: 100144 北京市石景山*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标签 数据 存储 方法 计算机 装置 介质
【说明书】:

发明公开了一种标签数据存储方法、计算机装置和存储介质,标签数据存储方法包括获取标签数据对应的位图数据,将位图数据存储到基于roaringbitmap的数据库中等步骤。本发明使用基于roaringbitmap的数据库存储与标签数据对应的位图数据,从而实现存储标签数据。由于一个桶中只需存储位图数据中的部分数据位,即可实现对位图数据的存储,也就是实现对标签数据的存储,因此可以节约存储空间,在相同性能表现的情况下可以降低存储成本。本发明广泛应用于数据存储技术领域。

技术领域

本发明涉及数据存储技术领域,尤其是一种标签数据存储方法、计算机装置和存储介质。

背景技术

在用户行为分析和人工智能学习等领域,需要使用和存储标签数据,例如用户行为分析中用于标记用户画像的性别、年龄、城市和近日活跃时长等数据属于统计类标签,用户行为分析中根据“近30天交易次数≥2”定义“消费活跃”等数据属于规则类标签,人工智能学习中通过数据挖掘产生的数据,例如根据用户的消费习惯判断其对某商品的偏好程度等数据属于机器学习挖掘类标签。在用户行为分析和人工智能学习等领域,需要使用大量的标签数据,为存储这些标签数据将需要大量的存储空间。如果使用能够节约存储空间的存储技术去存储这些标签数据,可以减少对存储空间的占用,从而在相同性能效果的情况下降低对存储空间的要求,尤其在标签数据数量巨大时能够取得非常明显的成本节约效果。

发明内容

针对上述至少一个技术问题,本发明的目的在于提供一种标签数据存储方法、计算机装置和存储介质。

一方面,本发明实施例包括一种标签数据存储方法,包括:

获取所述标签数据对应的位图数据;

将所述位图数据存储到基于roaringbitmap的数据库中。

进一步地,所述将所述位图数据存储到基于roaringbitmap的数据库中,包括:

获取基于roaringbitmap的数据库;所述数据库中包括多个桶;

若所述数据库中存在第一桶,所述第一桶的地址与所述位图数据的第一部分数据位对应,将所述位图数据的第二部分数据位存储到所述第一桶,反之,则创建所述第一桶,将所述第二部分数据位存储到所述第一桶。

进一步地,所述将所述位图数据存储到基于roaringbitmap的数据库中,还包括:

若所述数据库中存在第二桶,所述第二桶的地址与所述位图数据的第三部分数据位对应,所述第三部分数据位为所述位图数据中除了所述第一部分数据位和所述第二部分数据位之外的其他数据位,建立所述第一桶到所述第二桶的映射关系,反之,则创建所述第二桶,建立所述第一桶到所述第二桶的映射关系。

进一步地,所述将所述位图数据存储到基于roaringbitmap的数据库中,还包括:

当所述标签数据被扩充,获取所述位图数据中相应被扩充出的第四部分数据位,将所述第四部分数据位存储到所述第二桶。

进一步地,所述创建所述第一桶,包括:

当所述位图数据为元素,则将所述第一桶配置为数组桶;

当所述位图数据为元素序列,则分别确定第一空间占用和第二空间占用的大小,所述第一空间占用为所述第一桶被配置为数组桶的情况下将所述位图数据存储到所述第一桶所占用的空间,所述第二空间占用为所述第一桶被配置为执行桶的情况下将所述位图数据存储到所述第一桶所占用的空间,当所述第一空间占用小于所述第二空间占用,则将所述第一桶配置为数组桶,当所述第一空间占用大于所述第二空间占用,则将所述第一桶配置为执行桶。

进一步地,所述创建所述第一桶,还包括:

当所述第一桶的容量不超过容量阈值,则将所述第一桶配置为数组桶;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北明数科信息技术有限公司,未经北京北明数科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011171236.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top