[发明专利]数据压缩方法、装置、系统以及服务器有效
申请号: | 201210175371.4 | 申请日: | 2012-05-30 |
公开(公告)号: | CN102761540A | 公开(公告)日: | 2012-10-31 |
发明(设计)人: | 向明;王海洋;郑相振;阮卫挺 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 梁军 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据压缩 方法 装置 系统 以及 服务器 | ||
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据压缩方法、装置、系统以及服务器。
背景技术
在现有技术中,压缩工具通过一定的压缩算法改变文件内容和数据,使得数据占用更小的存储空间。具体地,普通文件一般都包含一定的重复数据,这些重复的数据往往占据多倍的存储空间,压缩工具需要查找文件内的这些重复数据,通过合适的算法将数据进行重建,让多个重复数据只占用一个存储空间,在解压缩时,再通过相应的解压算法将压缩后的文件进行还原,这种压缩算法一般属于无损压缩。例如,在文本文件中包含多个相同的词中华人民共和国,通过压缩工具压缩之后,只需占用一个存储空间进行存储,从而达到缩小文件的目的。
此外,压缩工具不仅能够帮助用户节省空间,同时也能将多个文件打成一个压缩包,以方便用户备份、传输和分享。目前,现有技术中有多款压缩工具,例如:winzip压缩工具,winrar压缩工具,7-zip压缩工具等;与压缩工具相对应的压缩算法也有多种,例如:rar格式、zip格式、7z格式、cab格式等。
上述的每个压缩工具和压缩算法都有各自特点。例如:zip格式的优点是使用广泛,压缩速度快,但是压缩率较小;rar格式通常比zip格式的压缩率要高,但是压缩速度较慢,并且winrar压缩工具对于文本、声音、以及图像在32位和64位英特尔(Intel)微处理器上能够执行程序压缩特殊优化算法,进一步提高了压缩率;7z格式通常比zip格式和rar格式压缩率都要高,同时压缩时间也比zip格式和rar格式都要长。
在现有技术中,有些文件格式的数据是已经进行过压缩的,例如,rmvb格式的视频文件,图1是现有技术中使用压缩软件进行参数配置的示意图,在用户使用压缩工具进行文件压缩时,压缩工具需要对用户选择的所有文件都进行压缩。但是,对于有些已经压缩过的文件格式或者冗余信息比较少的文件格式,通过压缩工具进行压缩后,基本无法减少文件体积,或者减少的文件体积非常有限。如果针对这类文件格式的数据进行压缩,不仅达不到压缩文件的目的,还会浪费很多压缩时间,并且,在压缩这些文件格式时也浪费了较多的CPU、内存等系统资源,却没有达到较好的压缩效果。
发明内容
本发明提供一种数据压缩方法、装置、系统以及服务器,以解决现有技术中对已经压缩过的或者冗余信息比较少的文件格式再进行压缩而导致的压缩时间和系统资源浪费的问题。
本发明提供一种数据压缩方法,包括:调用预先存储的压缩方式配置表,其中,压缩方式配置表包括:文件类型与压缩方式之间的对应关系;获取数据的文件类型,根据压缩方式配置表确定是否存在与文件类型相对应的压缩方式,如果存在,则获取与文件类型相对应的压缩方式;根据获取的压缩方式对待压缩数据进行压缩。
优选地,上述方法还包括:压缩方式配置表中的信息与服务器同步,服务器统计各文件类型的平均压缩率,根据平均压缩率设置压缩方式配置表中的文件类型与压缩方式之间的对应关系。
优选地,上述压缩方式配置表具体包括:文件类型、压缩算法、统计完成标识符、平均压缩率、以及压缩方式之间的一一对应关系;
优选地,上述待压缩数据包括一个或多个文件。
优选地,上述压缩方式包括:标准压缩方式、快速压缩方式、以及存储压缩方式,其中,标准压缩方式采用默认的压缩算法对文件进行压缩,快速压缩方式采用压缩时间最短的压缩算法对文件进行压缩,存储压缩方式采用直接将文件存储在压缩包中的方式。
优选地,上述方法还包括:在不存在与文件类型相对应的压缩方式的情况下,采用标准压缩方式对待压缩数据进行压缩,并将当前的压缩参数信息发送到服务器,其中,压缩参数信息包括:文件类型、压缩算法、文件大小、文件数量、以及压缩率。
优选地,所述服务器统计各文件类型的平均压缩率,根据平均压缩率设置所述压缩方式配置表中的文件类型与压缩方式之间的对应关系具体:服务器对接收到的压缩参数信息进行存储,在相同文件类型的压缩参数信息的数量达到预定阈值的情况下,对压缩参数信息进行统计,计算在不同的压缩算法下,该文件类型的平均压缩率,并根据平均压缩率确定相应的压缩方式;服务器将不同的压缩算法、相应的平均压缩率、以及相应的压缩方式存储在压缩方式配置表中与文件类型相对应的位置中;服务器将压缩方式配置表同步到用户计算机中。
优选地,根据压缩方式配置表确定是否存在与文件类型相对应的压缩方式还包括:根据压缩方式配置表获取与文件类型相对应的统计完成标识符,在统计完成标识符表示已完成的情况下,确定压缩方式配置表中存在与文件类型相对应的压缩方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210175371.4/2.html,转载请声明来源钻瓜专利网。