[发明专利]一种可扩展标记语言XML文档的压缩、解压方法和装置在审
申请号: | 202010418604.3 | 申请日: | 2020-05-18 |
公开(公告)号: | CN111797596A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 薛军超 | 申请(专利权)人: | 冠群信息技术(南京)有限公司 |
主分类号: | G06F40/146 | 分类号: | G06F40/146;H03M7/30 |
代理公司: | 南京瑞华腾知识产权代理事务所(普通合伙) 32368 | 代理人: | 梁金娟 |
地址: | 210019 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 扩展 标记 语言 xml 文档 压缩 解压 方法 装置 | ||
1.一种可扩展标记语言XML文档的压缩方法,其特征在于,包括以下步骤:
接收并读取压缩前XML文档;
分别对XML文档中的标记文字串和属性文字串进行使用次数统计;
根据统计结果,将所述标记文字串和属性文字串分别进行排序;
根据排序结果,将所述标记文字串或属性文字串与映射字符进行依次映射,并建立映射表;
根据所述映射表,将XML文档中的所述标记文字串或属性文字串与对应的所述映射字符进行替换,获得压缩后XML文档。
2.根据权利要求1所述的可扩展标记语言XML文档的压缩方法,其特征在于,所述将标记文字串和属性文字串分别进行排序,具体包括:将所述标记文字串和属性文字串按照使用次数从高到低分别进行排序;
对于使用次数相同的标记文字串或属性文字串,按照相应字符串的字符数量高低进行排序。
3.根据权利要求1所述的可扩展标记语言XML文档的压缩方法,其特征在于,所述使用次数统计采用计数器进行统计,所述标记文字串或属性文字串每出现一次,则在相应文字串数量上加一。
4.根据权利要求1所述的可扩展标记语言XML文档的压缩方法,其特征在于,所述映射表包括标记映射表和属性映射表,所述标记映射表和属性映射表以独立文件形式存储于压缩包中。
5.根据权利要求1所述的可扩展标记语言XML文档的压缩方法,其特征在于,所述映射字符为单字节字符,所述映射字符数量为115个,其符合XML标准定义且可作为标记名称使用。
6.根据权利要求1所述的可扩展标记语言XML文档的压缩方法,其特征在于,所述映射字符为双字节字符,所述双字节字符的第一个字节为下划线字符“_”,其第二个字节为单字节字符;
或所述双字节字符的第一个字节和第二个字节均为单字节字符。
7.一种可扩展标记语言XML文档的解压方法,其特征在于,包括以下步骤:
获取压缩包,所述压缩包包括压缩后XML文档和映射表;
读取所述压缩包中压缩后XML文档和映射表;
查找映射表中标记文字串或属性文字串与映射字符之间的映射关系;
根据所述映射关系将所述标记字符串和属性文字串分别与各自对应的映射字符进行替换,获得压缩前XML文档。
8.一种可扩展标记语言XML文档的压缩装置,其特征在于,包括:
接收读取模块,用于接收并读取压缩前XML文档;
次数统计模块,用于分别对XML文档中的标记文字串和属性文字串进行使用次数统计;
排序模块,根据统计结果,将所述标记文字串和属性文字串分别进行排序;
映射模块,根据排序结果,将所述标记文字串或属性文字串与映射字符进行依次映射,并建立映射表;
替换模块,根据所述映射表,将XML文档中的所述标记文字串或属性文字串与对应的所述映射字符进行替换,获得压缩后XML文档。
9.根据权利要求8所述的可扩展标记语言XML文档的解压装置,所述映射表包括标记映射表和属性映射表,其特征在于,还包括存储模块,用于将所述标记映射表和属性映射表以独立文件形式存储于压缩包中。
10.一种可扩展标记语言XML文档的解压装置,其特征在于,包括:
压缩包获取模块,用于获取压缩包,所述压缩包包括压缩后XML文档和映射表;
压缩包读取模块,用于读取所述压缩包中压缩后XML文档和映射表;
映射关系查找模块,查找映射表中标记文字串或属性文字串与映射字符之间的映射关系;
映射字符替换模块,用于根据所述映射关系将所述标记字符串和属性文字串分别与各自对应的映射字符进行替换,获得压缩前XML文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冠群信息技术(南京)有限公司,未经冠群信息技术(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010418604.3/1.html,转载请声明来源钻瓜专利网。