[发明专利]误差界限浮点数据压缩系统在审

申请号：	202010735951.9	申请日：	2020-07-28
公开（公告）号：	CN113031910A	公开（公告）日：	2021-06-25
发明（设计）人：	M.鲁普	申请（专利权）人：	SAP欧洲公司
主分类号：	G06F7/483	分类号：	G06F7/483;G06F9/30;H03M7/30
代理公司：	北京市柳沈律师事务所 11105	代理人：	邵亚丽
地址：	德国瓦***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	误差界限浮点数据压缩系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种系统包括：接收多个原始浮点值，将多个原始浮点值中的每一个舍入为相应的舍入浮点值，其中，每个舍入浮点值在其相应的原始浮点值的误差界限内，压缩多个舍入浮点值，以及将多个压缩舍入浮点值存储在数据存储系统中。

背景技术

现代计算部署生成大量数据。该数据的存储消耗了大量的计算资源。数据压缩技术可以用于减少存储的数据的量，并因此也减少存储数据所需的资源。

数据压缩可以是无损的，其中可以从压缩数据中准确地重现原始数据，数据压缩也可以是有损的，其中不能保证从压缩数据中准确地重现原始数据。与无损压缩相比，有损压缩通常展现出更高的压缩比和/或更快的处理。在特定情境中应用的压缩技术取决于情境的容错能力以及要压缩的数据类型。

诸如物联网(IoT)架构的系统可以生成浮点数据。例如，IoT传感器可以提供温度数据，该温度数据在从摄氏温度转换为华氏温度后，表示为64位双精度值。因此，需要在存储之前对该数据进行压缩。此外，由于IoT传感器的已知准确度限制，可能允许存储这些值以使得解压缩将导致每个值的最大误差界限为0.01。

例如，鉴于误差界限为0.01，将假设要存储值{1.241，1.240，1.239，1.241，1.253}。根据用于有损浮点压缩的已知方法，前四个值被识别为处于相同值(即1.24)的误差界限内，并因此这些值存储为{4x1.24，1x1.253}(例如，“游程(run)”数组{4，1}和“值”数组{1.24，1.253})。但是，如果连续值相对于误差界限有显著变化(例如{1.2348903，3.489345，-21.2344903，...}，则已知方法将数据存储为{1x1.2348903，1x3.489345，1x-21.2344903......}(例如，如“游程(run)”数组{1，1，1，...}和“值”数组{1.2348903，3.4489345，-21.2344903，...})，这无法提供令人满意的压缩。

期望对误差界限浮点压缩进行改进。

附图说明

图1图示了根据一些实施例的用于生成、压缩、存储和检索浮点值的架构。

图2是根据一些实施例的浮点传感器值的表格表示。

图3是根据一些实施例的图2传感器值的双精度版本的表格表示。

图4是根据一些实施例的基于误差界限来舍入浮点值的过程的流程图。

图5是根据一些实施例的图2传感器值的舍入版本的表格表示。

图6图示了根据一些实施例的用于压缩浮点值的处理流水线。

图7图示了根据一些实施例的用于压缩浮点值的处理流水线。

图8图示了根据一些实施例的用于压缩浮点值的处理流水线。

图9是根据一些实施例的基于误差界限和值的总和来舍入浮点值的过程的流程图。

图10是根据一些实施例的基于误差界限和值的总和来舍入浮点值的过程的流程图。