[发明专利]一种数据存储方法及装置在审
申请号: | 202010744904.0 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111881138A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 胡俊飞 | 申请(专利权)人: | 北京微步在线科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 喻嵘 |
地址: | 100086 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 存储 方法 装置 | ||
本发明公开了一种数据存储方法及装置,其中方法包括:基于数据库中存储的各历史数据的存储日期确定存储时间;在各历史数据的存储时间超过预设时间的情况下,以预定的时间周期为单位将各所述历史数据进行合并,获得合并后的数据;将各所述历史数据的存储日期按照预定的格式进行合并,获得用于标记所述合并数据中各历史数据的映射标记;按照预定的存储方式将所述合并后的数据以及所述映射标存储至所述数据库中。本发明通过根据历史数据库中历史数据的存储时间,来对超过预设时间的历史数据进行合并压缩,由此能够减小占用的存储空间。
技术领域
本发明涉及数据存储技术领域,特别涉及一种数据存储方法及装置。
背景技术
目前,非关系型的数据库(NoSQL)中,分布式的、面向列的开源数据库(HBase)以其基于日志结构合并树(Log-Structured Merge-Tree,LSM)、预写日志(Write Ahead Log,WAL)以及HFile的多层结构实现对数据的高吞吐量写入性能;同时通过刷新(flush)和合并(compaction)机制,来实现数据落盘及数据文件压缩,在保证高写入性能、持久化的前提下尽可能地提升读性能。
但是,现有技术中在保存数据过程中采用标识映射日期的方式,比如标识某个用户是否在某天登录过账号,或者某个域名是否指向某个IP等。在数据量比较少的情况下,可以通过保存全量记录的方式来设计存储。当数据量大的时候,比如有亿级以上域名与亿级以上IP映射的时候,每天都保存全量记录的方式会造成存储空间占有较大|、查询开销较大的问题。并且在对数据库中存储的数据进行更新时,由于需要先进行查询,因此造成查询操作的开销较大的问题
发明内容
本发明实施例的目的在于提供一种数据存储方法,用于解决现有技术中的数据存储占用存储空间较大的问题。
为了解决上述技术问题,本申请的实施例采用了如下技术方案:一种数据存储方法,包括如下步骤:
基于数据库中存储的各历史数据的存储日期确定存储时间;
在各历史数据的存储时间超过预设时间的情况下,以预定的时间周期为单位将各所述历史数据进行合并,获得合并后的数据;
将各所述历史数据的存储日期按照预定的格式进行合并,获得用于标记所述合并数据中各历史数据的映射标记;
按照预定的存储方式将所述合并后的数据以及所述映射标存储至所述数据库中。
可选的,所述方法还包括:实时获取待存储的目标数据以及所述目标数据的存储日期;
按照预设的存储格式将所述目标数据以及所述存储日期存储至所述数据库中。
可选的,所述方法还包括:对所述合并后的数据进行压缩,获得压缩后的数据。
可选的,所述预定周期为年;
所述以预定的时间周期为单位将各所述历史数据进行合并,获得合并后的数据,具体包括:
以年为单位将各所述历史数据进行合并,获得合并后的数据。
可选的,将各所述历史数据的存储日期按照预定的格式进行合并,获得用于标记所述合并数据中各历史数据的映射标记,具体包括:
创建包含48个字节的字节数组;其中每个字节包含8个比特位;
基于各所述历史数据的存储日期,确定所述字节数组中与各所述历史数据的存储日期对应的比特位,以作为目标比特位;
将所述目标比特位的值设置为第一预设值,将非目标比特位的值设置为第二预设值,以获得所述映射标记。
可选的,所述基于各所述历史数据的存储日期,确定所述字节数组中与各所述历史数据的存储日期对应的比特位,以作为目标比特位,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京微步在线科技有限公司,未经北京微步在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010744904.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多元酸改性环氧丙烯酸UV树脂及其制备方法和应用
- 下一篇:一种分度装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置