[发明专利]一种纸质文档图文信息采集与压缩的方法和系统无效
申请号: | 200810132610.1 | 申请日: | 2008-07-07 |
公开(公告)号: | CN101625684A | 公开(公告)日: | 2010-01-13 |
发明(设计)人: | 刘为为;胡锦龙 | 申请(专利权)人: | 全国组织机构代码管理中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李 玲 |
地址: | 100029北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纸质 文档 图文 信息 采集 压缩 方法 系统 | ||
技术领域
本发明涉及图文信息采集与压缩技术,特别是指一种纸质文档图文信息采集与压缩的方法和系统。
背景技术
奥运会等大型活动服务机构的电子档案库不仅包括组织机构代码的文本信息,同时还配套有批准文件、许可证、法人身份证、营业执照、登记证等影印文件,这些文件是进一步识别和比对企事业单位身份的重要依据。通过纸质文件扫描、软件压缩可以将这些文件合并到电子档案库,为使用方提供更详尽的信息支持。
奥运等大型活动的服务机构比较多,而且分散在不同的地方。为了集中收集这些档案,需要为每一个服务机构能提供一个搜集、制作电子档案文件的软件。同时扫描的文件一般都比较大,在现有的网络带宽环境下传输会比较慢。
发明内容
有鉴于此,本发明提出一种纸质文档图文信息采集与压缩的方法和系统,使电子文档的制作、传输更加方便。
基于上述目的本发明提供的一种纸质文档图文信息采集与压缩的方法,包括:
扫描文档并将扫描得到的电子文档保存为图像格式;
将图像格式的电子文档转换为专用图像文件格式。
可选的,该方法所述专用图像文件格式为二值电子文档格式。
可选的,该方法所述专用图像文件格式还包括:灰度格式、彩色格式中的一种或多种。
可选的,该方法所述二值电子文档格式包括:文件头数据块、文件背景信息数据块、文件安全访问控制数据块、文件尾数据块、目录信息数据块、页面索引数据块、页面图像数据块、附件数据块、页面附件元素描述数据块、文件元数据块。
可选的,该方法所述文件安全访问控制数据块包括:文件标识、加密方式、解密密码、文件校验码、用户权限;
所述目录信息数据块包括:目录节点、目录节点对应的页码;
所述页索引数据块包括:页面总数、页ID、页面类型、页顺序码、页码、页数据偏移量。
可选的,该方法所述将图像格式的电子文档转换为二值电子文档格式还包括:对转换后的文件进行加密。
可选的,该方法所述加密过程是按照字符排序进行混排加密。
可选的,该方法还包括转换后二值电子文档格式的电子文档解压流量的过程:
调用FreeFileBlocks,在内存中按照文件结构申请一个文件列表块大小的内存空间,将这部分内存中释放;
获得待处理文件的大小,申请同等大小的内存,将整个文件读入内存中,关闭该文件;
申请相应数据块对象,按照文件结构从内存中读取相应的数据块对象;
按照文件存储结构从内存中读取相应的数据块对象;
将读取的数据块加入块列表;
调用数据块对象的块碰到虚函数;
根据文件安全访问控制数据块结构,查找安全控制数据块解密;
定位页面索引数据块,定位页面数据数据块,绑定这两个数据块,得到加密数据块个数;
为每个加密数据块解密。
可选的,该方法所述扫描文档并将扫描得到的电子文档保存为图像格式还包括:对图像格式电子文档调整为统一样式的版面。
基于上述目的,本发明还提供了一种纸质文档图文信息采集与压缩的系统,包括:
扫描模块,用于将纸质文档扫描为电子文档;
格式压缩模块,用于将图像格式的电子文档转换为专用图像文件格式。
可选的,该系统所述专用图像文件格式为二值电子文档格式。
可选的,该系统所述专用图像文件格式还包括:灰度格式、彩色格式中的一种或多种。
可选的,该系统所述二值电子文档格式包括:文件头数据块、文件背景信息数据块、文件安全访问控制数据块、文件尾数据块、目录信息数据块、页面索引数据块、页面图像数据块、附件数据块、页面附件元素描述数据块、文件元数据块。
可选的,该系统所述文件安全访问控制数据块包括:文件标识、加密方式、解密密码、文件校验码、用户权限;
所述目录信息数据块包括:目录节点、目录节点对应的页码;
所述页索引数据块包括:页面总数、页ID、页面类型、页顺序码、页码、页数据偏移量。
可选的,该系统所述格式压缩模块还用于对转换后的文件进行加密。
可选的,该系统所述加密是按照字符排序进行混排加密。
可选的,该系统还包括解压浏览模块,其中包括用于调用FreeFileBlocks,在内存中按照文件结构申请一个文件列表块大小的内存空间,将这部分内存中释放的子模块;
获得待处理文件的大小,申请同等大小的内存,将整个文件读入内存中,关闭该文件的子模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全国组织机构代码管理中心,未经全国组织机构代码管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810132610.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种利用可识别数字序列的投递方法及系统
- 下一篇:高磅级偏心旋转耐磨球阀
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置