[发明专利]一种基于OpenXML的docx文档创建和修改方法有效
申请号: | 201310280580.X | 申请日: | 2013-07-05 |
公开(公告)号: | CN103309849A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 夏锋;程睿;孔祥杰 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 关慧贞;梅洪玉 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 openxml docx 文档 创建 修改 方法 | ||
技术领域
本发明涉及一种文档的创建和格式修改的方法,尤其涉及一种基于OpenXML的docx文档创建和格式修改方法。
背景技术
近年来,随着电子化办公逐渐普及,以及论文的撰写逐渐增加,人们对于Office工具的使用也越来越多。然而人们花在文档格式修改上的时间占据了相当一部分的文档完成时间,有时甚至是绝大部分,这样造成了时间、人力及物力大量的浪费。对于很多具有固定撰写模版的文档,如果用户可以提前定制好模板,就不用花费时间在修正格式方面,而是在内容修饰方面,从而可以大大节省时间,提高文档内容的水平。
Ecma Office Open XML(Open XML)是针对字处理文档、演示文稿和电子表格的国际化开放标准,可免费供多个应用程序在多个平台上实现。Microsoft Office(2007、2003、XP、2000)、OpenOffice Novell Edition、开源项目Gnumeric、Neo-Office2.1和PalmOS(Dataviz)已经支持Open XML。Open XML的标准化工作是由Ecma International通过其技术委员会45(TC45)执行的,来自Apple、Barclays Capital、BP、The British Library、Essilor、Intel、Microsoft、NextPage、Novell、Statoil、Toshiba和United States Library of Congress的代表参与了该项工作。该标准旨在提供现有ISO标准所无法提供的独特好处,其中包括能够实现从现有二进制格式向基于XML的格式的高保真移植。
由于docx格式文档使用OpenXML的规范控制格式,因此对于要求文档具有基本固定格式的创建和修改,可以不使用人工创建和修改的方式,而是通过创建和修改其对应的XML格式文件的方式实现对文档格式控制的自动化处理。
发明内容
为克服上述现有技术的不足,本发明提出一种基于OpenXML的docx文档创建和修改方法。
本发明所采用的技术方案是:通过对组成docx文档的XML文件的创建和标签修改实现对docx文档的创建和格式修改。
本发明将处理过程设计成如下四个步骤:文档及格式读取步骤,所需格式生成步骤,格式修改步骤和新文档创建步骤。
如图1是对程序中整个流程的图表化的展示,是从用户对格式需求的输入到格式规整的docx文档的输出的整个程序运行过程的表示。下面将对每个步骤进行简单的说明。
文档及格式读取步骤:本方法需要用户首先输入最终欲生成docx文档的格式,如果用户没有输入对应格式的需求,则本方法会默认为用户产生一个模版。表1则是用户需要在命令行中输入的部分重要的格式信息。待用户输入完毕,还需要选择生成全新的文档还是修改已经存在的docx文档的格式,如果生成全新的文档,则用户还需要将文档的文字单独录入;如果修改已经存在的docx文档的格式,则上传原docx文档即可。
所需格式生成步骤:根据用户输入的格式信息,本方法生成一份用于描述该格式的XML文件,其中用户没有定义的格式信息则按照默认格式信息处理。如果用户没有提供格式不整齐的原docx文档而需要生成新的文档,则还需要单独生成一些docx文档特有的XML文件,例如控制不同文件关系的XML文件和表示作者版权等信息的XML文件等。
格式修改步骤:如果用户提供了格式不整齐的docx文档,则本方法需要将用户输入的格式与现有docx文档中控制格式的word/document.xml文件进行对比,如果用户原来XML文件多添加了标签,则将其删除;如果原来XML文件用错了标签,则将其修改;如果原来XML文件少了标签,则将其加上。
新文档创建步骤:如果用户没有提供格式不整齐的docx文档,则将格式修改步骤中生成的所有XML文件按照docx文档的形式整合并且生成新的docx文档,如果用户提供了格式不整齐的docx文档,则将格式修改步骤中生成的XML文件替换用户提供的docx文档中的对应XML文件即可。
与现有技术相比,本发明的有益效果是大大提高了批量处理相同格式docx文档的效率,节省了用户大量的时间,同时,与目前存在的使用COM组件处理docx文档的方法比较,本发明使用了Java语言来处理,可以更加灵活方便的处理到每一个标签。
附图说明
图1为本方法处理过程流程图。
图2为示例文字生成的DOM树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310280580.X/2.html,转载请声明来源钻瓜专利网。