[发明专利]误差界限浮点数据压缩系统在审
申请号: | 202010735951.9 | 申请日: | 2020-07-28 |
公开(公告)号: | CN113031910A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | M.鲁普 | 申请(专利权)人: | SAP欧洲公司 |
主分类号: | G06F7/483 | 分类号: | G06F7/483;G06F9/30;H03M7/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 误差 界限 浮点 数据压缩 系统 | ||
一种系统包括:接收多个原始浮点值,将多个原始浮点值中的每一个舍入为相应的舍入浮点值,其中,每个舍入浮点值在其相应的原始浮点值的误差界限内,压缩多个舍入浮点值,以及将多个压缩舍入浮点值存储在数据存储系统中。
背景技术
现代计算部署生成大量数据。该数据的存储消耗了大量的计算资源。数据压缩技术可以用于减少存储的数据的量,并因此也减少存储数据所需的资源。
数据压缩可以是无损的,其中可以从压缩数据中准确地重现原始数据,数据压缩也可以是有损的,其中不能保证从压缩数据中准确地重现原始数据。与无损压缩相比,有损压缩通常展现出更高的压缩比和/或更快的处理。在特定情境中应用的压缩技术取决于情境的容错能力以及要压缩的数据类型。
诸如物联网(IoT)架构的系统可以生成浮点数据。例如,IoT传感器可以提供温度数据,该温度数据在从摄氏温度转换为华氏温度后,表示为64位双精度值。因此,需要在存储之前对该数据进行压缩。此外,由于IoT传感器的已知准确度限制,可能允许存储这些值以使得解压缩将导致每个值的最大误差界限为0.01。
例如,鉴于误差界限为0.01,将假设要存储值{1.241,1.240,1.239,1.241,1.253}。根据用于有损浮点压缩的已知方法,前四个值被识别为处于相同值(即1.24)的误差界限内,并因此这些值存储为{4x1.24,1x1.253}(例如,“游程(run)”数组{4,1}和“值”数组{1.24,1.253})。但是,如果连续值相对于误差界限有显著变化(例如{1.2348903,3.489345,-21.2344903,...},则已知方法将数据存储为{1x1.2348903,1x3.489345,1x-21.2344903......}(例如,如“游程(run)”数组{1,1,1,...}和“值”数组{1.2348903,3.4489345,-21.2344903,...}),这无法提供令人满意的压缩。
期望对误差界限浮点压缩进行改进。
附图说明
图1图示了根据一些实施例的用于生成、压缩、存储和检索浮点值的架构。
图2是根据一些实施例的浮点传感器值的表格表示。
图3是根据一些实施例的图2传感器值的双精度版本的表格表示。
图4是根据一些实施例的基于误差界限来舍入浮点值的过程的流程图。
图5是根据一些实施例的图2传感器值的舍入版本的表格表示。
图6图示了根据一些实施例的用于压缩浮点值的处理流水线。
图7图示了根据一些实施例的用于压缩浮点值的处理流水线。
图8图示了根据一些实施例的用于压缩浮点值的处理流水线。
图9是根据一些实施例的基于误差界限和值的总和来舍入浮点值的过程的流程图。
图10是根据一些实施例的基于误差界限和值的总和来舍入浮点值的过程的流程图。
图11是根据一些实施例的计算系统的框图。
具体实施方式
提供以下描述以使本领域的任何技术人员能够进行和使用所描述的实施例,并且阐述了预期用于实施一些实施例的最佳模式。然而,各种修改对于本领域技术人员将是显而易见的。
实施例涉及将多个浮点值中的每一个舍入到特定数目的小数位。舍入值中的每一个都在其原始值的指定误差界限内。然后对舍入后的值进行进一步的浮点压缩,根据一些实施例,其又可以包括整数压缩。一些实施例进一步操作以减小或消除误差界限的舍入值的总和相对于对应的原始浮点值的总和的差。
因此,一些实施例可以提供输入浮点值的改进的误差界限压缩,其相对于误差界限展现出连续值中的显著数目的小数位和/或大的方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010735951.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:从氟碳铈矿中高效提取稀土的方法
- 下一篇:显示装置