[发明专利]一种基于图像识别的文件压缩及解压缩处理方法无效

专利信息
申请号: 200910042172.4 申请日: 2009-08-26
公开(公告)号: CN101630415A 公开(公告)日: 2010-01-20
发明(设计)人: 罗笑南;郝晓;文允 申请(专利权)人: 中山大学
主分类号: G06T9/00 分类号: G06T9/00;G06F17/22
代理公司: 暂无信息 代理人: 暂无信息
地址: 510006广东省广州市番禺*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图像 识别 文件 压缩 解压缩 处理 方法
【说明书】:

技术领域

发明涉及文件信息处理技术领域,特别是涉及一种基于图像识别的文件压缩及解压缩处理方法。

背景技术

压缩文件的基本原理是查找文件内的重复字节,并建立一个相同字节的“词典”文件,并用一个代码表示,比如在文件里有几处有一个相同的词“中华人民共和国”用一个代码表示并写入“词典”文件,这样就可以达到缩小文件的目的。

通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说,压缩可以分为有损和无损压缩两种。有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。

压缩软件(compression software)自然就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。常见的压缩软件有winzip、winrar等。

由于解压缩是压缩的逆向过程,一般的解压缩过程也是一次性将文件读入内存,并通过逆向的算法过程,将文件整个进行还原。为了节省空间,一般文档采用压缩后的存储方式,当文档内容很多,特别是存在大量图片的时候,一次性的解压缩过程将需要占用很大的时间,造成了浏览上的不便。

发明内容

本发明的目的在于克服现有文件压缩及解压缩处理上的不足,提出一种基于图像识别的文件压缩及解压缩处理方法。

为了实现发明目的,采用的技术方案如下:

一种基于图像识别的文件压缩处理方法,包括了以下的步骤:

1)将文件进行内容识别,并划分为文本区和图片区;

2)图片以标签的形式存储在文本区,其图像像素信息存储在对应的图片区;

3)文本区和图片区进行压缩,文本区采用无损压缩的方法,图片区可采用有损压缩的方法,然后把将压缩后的文本区和图片区合并成新的文件。

步骤1)和2)所述的文件内容识别,通过解析文件的数据,如果是文本信息,则将文件中的文本信息存储到文本区,如果解析的是图片信息,则生成一个图片的文本标签,并将该图片标签存储到文本区,此外,生成该图片的图像像素信息,与图片标签相对应,保存到文件的图片区。

步骤3)所述的压缩方法中,文本区的内容,由于文本信息的重要性,采用的是无损压缩的方法,由于在压缩图片时,采用无损压缩一般压缩效果不明显,因此可以将图片进行转化,如将BMP的图片转化成JPG格式的图片,然后再进行压缩,增大压缩量。

一种基于图像识别的文件解压缩处理方法,包括以下步骤:

1)对文本区进行解压缩;

2)解析浏览信息内容;

3)如果信息内容包含有图片标签,则进行下一步,否则返回步骤2);

4)找到该图片标签对应图片区的数据块;

5)解压缩压缩后的图片信息;

6)返回图片的详细信息并返回步骤2)。

本发明的有益效果是:该发明不仅可以有效降低文档的存储空间,并且在解压缩过程中采用了分步解压缩的过程,用户在需要查看某些图片时,才对该图片进行解压缩。

附图说明

图1为文件的存储结构划分图;

图2为文件的压缩过程的流程图;

图3为浏览文件的解压缩的流程图。

具体实施方式

下面结合附图对本发明进行进一步阐述:

如图1所示,本发明中的文件的存储结构主要有文件头,文本区和图片区。

文件头包含了本次压缩方法的版本号,文本编码类型的信息,便于对文件进行识别。

文本区包含的是文件的正文信息。其中正文部分是文本信息,则将其放入文本区,否则,如果正文部分含有图片,则创建一个图片标签,如<IMG1,offset=0x00000000>,将图片标签添加到相应的文本区。同时在图片区创建相应的图片块,将图片的像素信息保存在图片区。

用户在浏览文本区中的图片标签时,可以通过标签中的位移offset的位置,到图片区的对应偏移位置提取相关的像素信息。并且,图片区中的每一张图片对应的信息块都是按照图片的格式采用不同的压缩算法进行了压缩。

本发明的压缩过程如图2所示,首先通过解析文件中的数据信息,并将信息划分成文本区和图片区。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910042172.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top