[发明专利]基于XML的不同格式文档的转换方法有效
申请号: | 200810115473.0 | 申请日: | 2008-06-24 |
公开(公告)号: | CN101615174A | 公开(公告)日: | 2009-12-30 |
发明(设计)人: | 李宁;侯霞 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 | 代理人: | 刘 芳 |
地址: | 100101北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xml 不同 格式 文档 转换 方法 | ||
技术领域
本发明涉及计算机信息交换技术领域,尤其涉及基于可扩展置标语言(eXtensible Markup Language,简称XML)的不同格式文档的转换方法。
背景技术
随着各种计算机技术的发展和广泛应用,由计算机处理的文档大量产生。特别是办公软件应用领域,存在大量的兼具显现式样和内容数据的文档。这些文档按照不同格式进行描述和存储,给不同的软件工具处理带来了兼容性问题。为了解决这个问题,国际和国内的标准化组织制定了数个文档格式标准。例如开放式文档格式(Open Document Format,简称ODF)标准、OOXML(Office Open eXtensible Markup Language,简称OOXML)及我国自主制定的国家标准UOF(Unified Office document Format,中文简称“标文通)。这些标准都是基于可扩展置标语言XML的。
XML产生于1998年,以其简单性、可验证性、可扩展性和互操作性等优点,辅以技术成熟、支持ISO/IEC 10646(Unicode)国际标准等特点,成为当今国内外电子商务与电子政务的关键信息交换技术之一。XML语言的结构化特性,使之成为描述各类文档格式标准的基础。
然而,对于上述基于XML的文档格式标准,它们描述文档内容和表现式样的方式却不尽相同,目前难以要求所有的软件必须能够存储和阅读所有格式的文档。一个可行办法是通过格式转换解决不同文档格式之间的兼容性问题。格式转换主要是实现显现式样之间的映射。现有技术中XML文档格式转换的一般做法是将整个文档提交给转换程序,转换程序按照可扩展式样单语言转换(Extensible Stylesheet Language,简称XSLT)式样单(Style Sheet) 中预先设计的规则,将源文档的节点树转换为目标文档的节点树,最后由转换程序保存转换后的新的文档。
由于电子文档的大量使用,文档格式转换遂成为一种经常使用的普遍的需求。然而,由于文档格式标准的多样性和格式转换的复杂性,在每一台主机上为所有格式安装转换器是不现实的,即使能够安装,也难以随着格式标准的更新对这些转换器进行维护。因此提供一种集中式的文档转换的方法成为一种需要,通过集中式的文档转换可以解决上述问题。
但是,采用集中式的文档格式转换服务存在以下问题:(1)格式转换服务的提供方一般难以保证是可信任的,特别是对于内容敏感的文档,要整体传送到格式转换程序是不安全的,因为非本地控制的格式转换程序很可能会留下文档的副本并将其传播出去;(2)要将动辄几十兆、上百兆的文档通过网络传送到格式转换服务的提供方会带来很大的流量开销,传送过程也会因此受阻。
发明内容
本发明的目的在于针对现有技术存在的问题,提供一种基于XML的不同格式文档的转换方法,能保证文档格式转换的安全性,减小格式转换时的数据传输量,使实现集中式的XML文档格式转换成为可能。
为了实现上述目的,本发明提供了一种基于XML的不同格式文档的转换方法,包括:
步骤1、本地程序将待转换文档中欲保护的节点内容替换成与所述节点内容对应的唯一标识符;
步骤2、将经过步骤1之后的文档,由格式转换服务提供方转换成目标格式;
步骤3、本地程序将转换成目标格式之后的所述文档中的唯一标识符, 还原成对应的所述欲保护的节点内容。
本发明提供的基于XML的不同格式文档的转换方法,为由格式转换服务的提供方集中将XML文档进行格式转换的实施提供了可能。本发明充分利用了XML文档格式和内容分离的优势,通过将待转换文档中的欲保护的节点内容转换成唯一标识符,将待转换文档进行格式转换后,再将目标格式的文档中的唯一标识符还原成待转换文档中相应的欲保护的节点内容。这样,在将待转换文档进行转换时,该文档的欲保护的内容信息不会被暴露,在进行文档转换时,不至于被提供格式转换服务的提供方留副本或传播出去,可以保证文档转换的安全性;并且由于进行文档转换时,不需要传输数据内容,大大降低了数据传送量,减少了数据传输流量开销。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1所示为本发明基于XML的不同格式文档的转换方法实施例一流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810115473.0/2.html,转载请声明来源钻瓜专利网。