[发明专利]数据压缩、扩展方法和装置以及使用该方法和装置的数据处理设备及网络系统无效
申请号: | 97101867.7 | 申请日: | 1997-01-31 |
公开(公告)号: | CN1167951A | 公开(公告)日: | 1997-12-17 |
发明(设计)人: | 道明诚一;吉浦裕;服部芳明;大津丰;村上弘真 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 叶恺东,王忠忠 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据压缩 扩展 方法 装置 以及 使用 数据处理 设备 网络 系统 | ||
本发明涉及一种把文字列等的数据变换为比该数据的比特数更短的比特串的数据压缩、扩展方法和装置以及使用该方法和装置的数据处理设备及网络系统。
数据压缩技术是削减硬盘等存储装置中的数据占有量和通信中的数据传输量,从而提高存储装置和通信线路的效率的技术。以往,提出了各种各样的数据压缩方法,作为有代表性的方法有数据压缩手册(トッパン、1994年)的第221~247页所述的LZ78及其改进型方法。
LZ78及其改进型方法是由下述的基本步骤构成的方法,这是一种按照预定的规则压缩数据的方法:
(1)存储代表输入数据的文字列。把这些存储的文字列的集合称之为动态辞典。
(2)当把与动态辞典中的文字列相同的文字列再现为输入数据的情况下,把代替该文字列的动态辞典中的该文字列的索引码(一般为正整数)作为输出数据输出。
(3)当所存储的文字列使动态辞典满额时,就不进行其超过部分的文字列的登录或删除登录完了的文字列。在删除登录完了的文字列的情况下,或是删除全部文字列,或是按顺序从更旧的文字列开始删除。
按照上述原来的方法,因为把由多个文字构成的文字列替换为一个索引码,所以能够压缩数据。而且,按上述的规则反向进行,可以容易地对用上述方法压缩的数据进行扩展变换。
在使用上述原来的动态辞典的数据压缩方法中,存在以下的问题:
(1)在输入数据中最初出现的文字列还未登录到动态辞典内,因此,并不替换为索引码,而是原样输出所输入的文字列。所以,输入数据的最初部分的压缩率特别低。
(2)因为把输入数据中的文字列安顺序逐次登录在动态辞典中,所以存在辞典溢出的情况,作为这时的解决办法,例如可以采取以下的删除步骤:
(a)在辞典中不再新增登录文字列。
(b)全部删除已登录的文字列,并把辞典初始化。
(c)保存更新的文字列,并删除旧的文字列。
不管在执行哪种删除步骤的情况下,存在于以后的动态辞典内的文字列再次出现在输入数据中的可能性都未必很高。一般,由于输入数据中的文字列与动态辞典中的文字列一致的频度小,所以压缩率低。
本发明的目的在于提供能够实现更高压缩率的数据压缩方法和装置。
本发明的另一个目的在于提供即使在输入数据的最初部分也不降低压缩率的数据压缩方法和装置。
本发明的另一个目的在于提供防止由于出现频度低的文字列占据辞典较多的部分而引起的压缩率降低的数据压缩方法和装置。
本发明的另外的目的在于提供把压缩了的数据扩展为原数据的数据扩展方法和装置。
本发明的另外的目的在于提供具备数据压缩功能和扩展功能的数据处理方法和装置。
本发明的另外的目的在于提供具备数据压缩功能和扩展功能的网络系统。
为实现上述的目的,本发明采取以下的构成。
第一,动态辞典和静态辞典并用,静态辞典不变更登录内容。静态辞典中登录着出现频度高而且比较长的文字列及其索引码。把静态辞典的索引码加在动态辞典的索引码上,作为压缩数据输出。
具体地讲,就是输出输入文字列(以下称“输入比特串”)、动态辞典的索引码、静态辞典的索引码的某一个代码以及作为译码用的辞典以用来选择动态辞典、静态辞典的某一方的代码。这时,先存储输入比特串代码的长度,在检索静态辞典时存储至少一个与输入比特串一致的索引码的代码长度;在登录动态辞典时,同样存储一致的代码的长度,再把上述输入比特串和索引码中更短的代码作为压缩数据输出。
在用静态辞典检出成为对象的比特串阶段,也可以输出静态辞典的索引码,并采用静态辞典优先方式。有关使用动态辞典的索引码的不希望压缩的部分,即有关输入数据的最初的部分,例如开头的500字节部分,也可以采用所谓使用输入比特串的代码或静态辞典的索引码进行编码的辞典切换方式。
无论以上的哪种构成,都能够解决以上的问题(1)。
第二,为解决上述的问题(2)可以采取以下①②的任一种构成:①不把利用率低的文字列登录在动态辞典中,②预见词典的溢出,并从动态词典中删除利用率低的文字列。
具体地对于第①点来说,在输入比特串与静态辞典的内容一致的情况下,不把其输入的比特串登录在动态辞典中。
而且,在事先调查把输入比特串登录到动态辞典内时的索引码并作为输出数据编码的情况下,当动态辞典的索引码与静态辞典的索引码相比被判断为更短时,也可以把动态辞典的索引码登录下来。
另外,也可以使用静态辞典的属性信息、出现概率或比特串之间的关联关系中的至少一种信息作为附加信息,而根据该附加信息不登录输入比特串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/97101867.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:四氢异喹啉衍生物及其用途
- 下一篇:玻璃上的涂层