[发明专利]基于抽样猜测的数据压缩方法有效
申请号: | 201811000116.X | 申请日: | 2018-08-30 |
公开(公告)号: | CN110875743B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 曹世强;简廷芳;郑又嘉 | 申请(专利权)人: | 上海川源信息科技有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 南霆;王宁 |
地址: | 201306 上海市浦东新区(上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 抽样 猜测 数据压缩 方法 | ||
本发明提供一种基于抽样猜测的数据压缩方法,包含:接收一笔数据;于该笔数据的M个数据区域中,抽取N个数据区域;检查N个数据区域中的数据累赘占比;及根据数据累赘占比多寡决定是否压缩该笔数据。
技术领域
本发明涉及一种压缩方法,特别是有关于一种基于抽样猜测的数据压缩方法。
背景技术
实时数据压缩有快速压缩的需求,通常采用压缩能力较差但具有较快压缩速度的算法。然而,为了达到快速的需求,常常无法判断是否有足够的数据累赘,导致造成压缩后的数据比压缩前的数据还大的现象,此为无意义的压缩。
发明内容
有鉴于此,本发明一实施例提出一种基于抽样猜测的数据压缩方法,包含:接收一笔数据,该笔数据包含M个数据区域;于该笔数据的M个数据区域中,抽取N个数据区域,其中NM,且N与M为正整数;检查N个数据区域中的数据累赘占比;及根据数据累赘占比多寡决定是否压缩该笔数据。
本发明另一实施例还提出一种基于抽样猜测的数据压缩方法,依序对多笔数据的每一笔数据执行下列步骤:于该第i笔数据的Mi个数据区域中,抽取Ni个数据区域,其中NM,且N、M与i为正整数;检查Ni个数据区域中的数据累赘;于所抽取的各数据区域中均为数据累赘的占比至少为阈值时,将该第i笔数据存放于缓冲区中;及当满足压缩条件时,压缩缓冲区中的第x笔至第i笔的数据,该压缩条件为且其中x、K为正整数。
综上所述,根据本发明实施例所述的基于抽样猜测的数据压缩方法,可对欲储存的数据进行抽样,检查数据累赘的比例,据以推估数据值不值得压缩,据此可兼顾压缩速度及压缩率。
附图说明
图1为本发明一实施例的系统架构图。
图2为本发明一实施例的基于抽样猜测的数据压缩方法流程图。
图3为本发明另一实施例的基于抽样猜测的数据压缩方法流程图。
符号说明:
100 计算机系统
110 处理器
120 瞬时储存装置
121 缓冲区
130 非瞬时储存装置
140 输入设备
200 数据
具体实施方式
参照图1,为本发明一实施例的系统架构图。本发明实施例由计算机系统100实现。计算机系统100包含处理器110、瞬时储存装置120(如挥发式内存)、非瞬时储存装置130(如硬盘、固态硬盘等)及输入设备140(如网络接口、外接储存装置(如随身碟、外接硬盘等))。计算机系统100可例如为个人计算机、服务器、服务器群集等。瞬时储存装置120包含缓冲区121。在一些实施例中,缓冲区121是位于非瞬时储存装置130中的挥发式内存上。在一些实施例中,缓冲区121是位于非瞬时储存装置130中的非挥发式储存介质上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海川源信息科技有限公司,未经上海川源信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811000116.X/2.html,转载请声明来源钻瓜专利网。