[发明专利]压缩数据记录和处理压缩数据记录的方法和系统有效
申请号: | 201180015734.1 | 申请日: | 2011-02-04 |
公开(公告)号: | CN102906740A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | J.比尔纳特;M.赫梅尔;N.霍伊斯尔 | 申请(专利权)人: | 帕斯特里姆有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H03M7/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 吕晓章 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 压缩 数据 记录 处理 方法 系统 | ||
技术领域
本发明涉及处理由数据记录组成的数据集合,尤其在数据库系统中处理由数据记录组成的数据集合的方法。更具体地说,本发明涉及数据记录的压缩和压缩数据的处理。本发明进一步涉及包含压缩数据记录的数据结构产品,以及数据库计算机系统和计算机程序。
背景技术
借助于数据库,数据集合可以,例如,通过搜索它们或通过将它们相互组合评估它们来处理。
在许多情况下,提供数据集合是为了在从数据集合中生成的具有二进制结构的数据记录中,取决于使用的数据,部分包含在宽广的局部区域上只包括零值的二进制数据结构。当生成数据集合时,可以碰到,例如,只略为不同的数据不能组合在一起,而是生成两个不同数据记录的情况。因此,数据库中的数据记录的数量经常非常大。
不过,为了能够良好地管理数据记录,不损失信息地减小数据的大小已成为趋势。这是通过,例如,数据压缩实现的。
这具有在很大程度上减少,例如,要以电子形式存储的数据的数量的优点。但是,在像数据组合那样的电子处理操作中,每个压缩数据都必须完全解压,因此返回到原始状态,以便能够进行相应处理操作。作为进行解压处理的后果,使处理时间增加了。
并且,数据在处理之前必须返回到原始状态或被解压,只可以依次处理数据。这样做的原因是由于压缩的类型,在大多数情况下,只能依次进行解压。为了在数据的电子处理中存储中间结果,需要可以保持解压的很大随机访问存储器。
EP 0 633 537 B1公开了在以压缩代码形式存储在压缩文件中存储的多个字符串的同时搜索压缩文件的方法和系统。接收查询请求,将查询请求转换成压缩代码,将转换的查询请求与存储在压缩文件中的压缩代码相比较。
发明内容
按照本发明,分别提出了包含权利要求1的特征的方法、具有权利要求15和16的特征的数据存储介质或数据结构产品、利用权利要求22的特征处理压缩数据记录的方法以及具有权利要求25和26的特征的数据库计算机系统。
本发明提供了将具有二进制结构的数据记录划分成若干位矢量。每个位矢量的大小通过首先将位矢量划分成大小相等的相继分区来减小,每个分区由n个位组成。然后,取决于它们的内容结构,将这些分区分类成平凡分区(trivial partial area)、准平凡分区或非平凡分区。
将位矢量的一个或几个相继非平凡分区组合成一个所谓的R块。除去平凡分区。将位矢量的一个或几个相继准平凡分区组合成一个所谓的O块。
这样,可以显著减小数据记录的大小。
当将一个位矢量的非平凡分区组合成一个所谓的R块时,可以将包括在各自R块中的第一非平凡分区的第一位的绝对位矢量位置PR和所谓R块中的相继非平凡分区的个数mR标注在R块中。这为R块的内容的快速确定和相应快速数据检索创造了条件。个数mR给出R块中的相继非平凡分区的计数或数量。
当将一个位矢量的准平凡分区组合成一个所谓的O块时,可以将包括在所谓O块中的第一准平凡分区的第一位的绝对位矢量位置PO和O块中的相继准平凡分区的个数mO标注在O块中。这为O块的内容的快速确定和相应快速数据检索创造了条件。个数mO给出O块中的相继准平凡分区的计数或数量。
并且,可以除去(删除)有助于另外减小位矢量的大小的准平凡分区。
在如本发明所提出的减小中,没有信息损失。该减小可以,例如,在电子数据处理中通过数据压缩来进行。由于位矢量的大小的减小,所以使要处理的数据的数量显著减少。在这种背景下,本发明保证了通过这种压缩减少每个位矢量的大小。为此,将每个位矢量划分成大小相等的相继分区,每个分区由n个位组成。分区现在可以包含具有不同值的位或只包含具有相同值的位。
在此基础上,可以将分区分类成不同分区。平凡分区和准平凡分区可以是,例如,具有规则位结构的分区。可以将平凡分区定义成只包含零的分区,而可以将准平凡分区定义成只包含一的分区。非平凡分区是包含一和零两者的分区。要注意的是,上面对分区的各自名称的定义不应该理解为限制性的,而只是作为例子给出。当然,在本发明的背景下也可以将位只具有1值的分区定义成平凡分区,然后将位只具有0值的分区定义成准平凡分区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于帕斯特里姆有限责任公司,未经帕斯特里姆有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180015734.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:循环移动载体生物膜反应器
- 下一篇:一体化塔式含硫废水处理装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置