[发明专利]XML格式文档转换为Word格式文档的系统和方法有效

专利信息
申请号: 201010285320.8 申请日: 2010-09-17
公开(公告)号: CN101963955A 公开(公告)日: 2011-02-02
发明(设计)人: 解辉 申请(专利权)人: 深圳市万兴软件有限公司
主分类号: G06F17/22 分类号: G06F17/22
代理公司: 深圳市君胜知识产权代理事务所 44268 代理人: 刘文求;韩金明
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: xml 格式 文档 转换 word 系统 方法
【说明书】:

技术领域

发明涉及格式文档转换的系统领域,更具体的说,改进涉及的是一种XML格式文档转换为Word格式文档的系统和方法。

背景技术

Microsoft Word是微软公司的一个文字处理应用程序,在办公自动化中,Microsoft Word得到了越来越多的应用。然而,在自动化办公应用非常广泛的今天,如何根据已有的大量XML(Extensible Markup Language,可扩展标记语言)信息高效、稳定地批量生成Word文档,已成为迫切的需求。

现有的技术中,有的通过调用一些成熟的开源文档编辑软件的接口来实现MS-Word基本信息的写入,较流行的是调用OpenOffice的API接口来实现Word文档的生成。还有的通过研究doc二进制文件的信息,来猜测MS-Word文件的写入规则,之后利用猜测到的规则来实现Word文档的生成。

但是,现有的技术中调用OpenOffice的API接口生成Word文档的做法,由于doc文件的内部格式没有公开,所以当今一些主流的开源软件对其支持的并不完美,经常会造成元素丢失和排版混乱的情况。而现有的技术中依靠猜测MS-Word文件的写入规则生成Word文档的做法,由于仅仅是猜测doc文件的写入规则,现在情况下仅能支持一些简单元素的输入和简单排版的设置,对复杂文档支持较差,并且只能支持单一Word版本文档的生成,无法实现批量生成Word文档。

因此,现有技术尚有待改进和发展。

发明内容

本发明的目的在于,提供一种XML格式文档转换为Word格式文档的系统和方法,可支持Word格式的排版风格,可避免频繁地调用MS-Word的Com接口而导致占用较多的系统资源,可稳定高效批量地将XML格式文档转换为Word格式文档。

本发明的技术方案如下:

一种XML格式文档转换为Word格式文档的方法,其中,包括以下步骤:

读取XML格式文档中的基本元素信息;

按照Word格式文档的排版风格对读取的基本元素信息进行排版处理;

将排版处理后的信息生成RTF格式文档;

调用MS-Word的Com接口将RTF格式文档转换为Word格式文档。

所述的XML格式文档转换为Word格式文档的方法,其中,在读取XML格式文档基本元素信息的步骤中,具体包括以下步骤:

通过XML文件读取模块中的XML读取库将基本元素读出;

按照基本元素的类型对元素进行分组,对各组的元素按照层次顺序进行重新排列;

将重新排列后的元素信息输入到中间数据结构中。

所述的XML格式文档转换为Word格式文档的方法,其中,在进行Word格式文档风格排版处理的步骤中,对于类型为文本的基本元素,包括以下步骤:

对多个文本块进行横向切割;

判断纵向区间内同一垂直方向上是否存在有两个文本块;

在否的情况下将文本块合并成行。

所述的XML格式文档转换为Word格式文档的方法,其中,在进行Word格式文档风格排版处理的步骤中,对于类型为文本的基本元素,包括以下步骤:

对多个文本行进行纵向切割;

判断横向区间内同一水平方向上是否存在有两个文本行;

在否的情况下将文本行合并成一个文本段。

所述的XML格式文档转换为Word格式文档的方法,其中,在进行Word格式文档风格排版处理的步骤中,对于类型为图元和图像的基本元素,包括以下步骤:

若一个图元或者图像的区域位于一个文本段的区域内,则将该图元或者图像作为该文本段的背景信息;

若该图元或者图像的区域超过了一个文本块的区域,则将该图元或者图像作为整个页面的背景信息。

所述的XML格式文档转换为Word格式文档的方法,其中,在生成RTF格式文档的步骤中,还包括以下步骤:

每生成一个文本或者图元,都要先在颜色表中查询该颜色是否存在,如果存在则提取该颜色的索引值,如果不存在则在颜色表中新建该颜色对象并提取该颜色的索引值。

所述的XML格式文档转换为Word格式文档的方法,其中,在生成RTF格式文档的步骤中,还包括以下步骤:

每生成一个文本对象都要查询该文本的字体在字体表中是否存在,如果存在则将该字体在字体表中的索引值作为输入值进行输入,如果不存在则在字体表中新建该字体对象并将新建字体对象的索引值作为输入值进行输入。

所述的XML格式文档转换为Word格式文档的方法,其中,在生成RTF格式文档的步骤中,还包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市万兴软件有限公司,未经深圳市万兴软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010285320.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top