[发明专利]模板文档自动生成方法在审
申请号: | 201510822691.8 | 申请日: | 2015-11-24 |
公开(公告)号: | CN105426352A | 公开(公告)日: | 2016-03-23 |
发明(设计)人: | 徐志强;刘正桃;谢欣涛;陈剑;肖振锋 | 申请(专利权)人: | 国家电网公司;国网湖南省电力公司;国网湖南省电力公司经济技术研究院;湖南天下宽信息技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 长沙永星专利商标事务所 43001 | 代理人: | 周咏;米中业 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模板 文档 自动 生成 方法 | ||
技术领域
本发明属于智能信息管理及应用技术领域,具体涉及模板文档自动生成方法。
背景技术
随着信息技术的高速发展,信息技术渗入至各行各业,为每个行业带来了翻天覆地的变化,不仅优化了工作流程,而且很大程度上提高了工作效率。作为模板性文档特别多的科研院所、设计单位,为了提高工作效率、降低文档差错率,每个单位迫切需要一个解决此类模板性文档自动生成文件的工具,并全面提升工作效率及质量,其模板文档快速生成文件需要高效的快速生成方法。
基于DOM目录树自定义标签遍历方法是模板文档生成文件的一种可行方法(找到相应的自定义标签进行数据信息替换),其基本步骤主要是:首先根据文档材料动态生成相关的DOM目录树格式;其次在DOM目录树的基础上进行自定义标签遍历,基于DOM目录树模型模板文档生成具有简单有效且计算结果准确等特点,但其随着DOM目录树的深度或层次的增加,其遍历量按指数级增加,影响模板文档生成效率,从而很大程度上制约了该方法在模版文档自动生成方面的深入应用。
发明内容
本发明的目的在于提供一种高效、快速的模板文档自动生成方法。
本发明提供的这种模板文档自动生成方法,其特征在于包括如下步骤:
S1根据模板文档生成DOM格式目录树,并产生与之相匹配的决策树;
S2对步骤S1产生的决策树进行多叉和多级调整优化,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率;
S3通过决策树遍历效率及模板文档生成效率筛选出最优与之DOM数据路相匹配的决策树模型;
S4按照S3中筛选出的决策树模型,生成已经进行替换和属性变更的文档。
所述的步骤S1中的产生相匹配的决策树,为在遍历DOM格式目录树的同时,按同样的树形结构生成决策树,决策树的节点来自DOM目录树,决策树的节点通过标识进行标注,标识决策树节点有无子节点,节点下有无模板标签及标签类型,且当DOM目录树上节点下无模板标签,则决策树删除此节点,直到DOM目录树遍历完成,从而生成完整的决策树。
所述的遍历优化决策树,为采用深度优先算法进行遍历。
所述的筛选出最优的决策树模型,为依据遍历时间最小原则筛选出决策树模型。
本发明提供的这种模板文档自动生成方法,由于采用了与DOM格式目录树相匹配的决策树,并通过对决策树的筛选最终生成最优的决策树模型,并依据该决策树模型生成模板文档,因此本发明能够不受目录树的深度或层次的影响,能够高效、快速的生成模板文档。
附图说明
图1为DOM格式目录树的结构示意图。
图2为DOM格式目录树的树形图。
图3为DOM相匹配的决策树的结构示意图。
图4为DOM相匹配的决策树的树形图。
图5为本发明的方法流程图。
具体实施方式
如图1所示为本发明的方法根据模板文档生成的DOM格式目录树的结构示意图:可以看到图中的目录树包括元素、属性和文本;如图2所示为DOM格式目录树的树形图;如图3所示为本发明的方法生成的与DOM格式目录树的决策树,用于辅助决策快速遍历DOM目录树;如图4所示为DOM相匹配的决策树的树形图。
如图5所示为本发明的方法流程图:
步骤1:根据模板文档生成DOM格式目录树,并产生与之相匹配的决策树;
根据基于XML格式模板文档生成如图1所示的DOM格式目录树,包括模板文档所包含的模板文档的标题、段落、样式等属性信息,在生成DOM格式的同时产生与之相匹配的自定义标签决策树。
如图2所示为DOM格式目录树的树形图;采取深度优先遍历算法,在遍历DOM格式目录树的同时按同样的树形结构生成决策树,决策树的节点同样来自DOM目录树,但是决策树的节点通过标识进行标注,标识决策树节点有无子节点,节点下有无模板标签及标签类型,当DOM目录树上节点下无模板标签,则决策树删除此节点,直到DOM目录树遍历完成,从生成完整的决策树,如图4所示。
步骤2:调整优化决策树,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率;
通过改进优化决策树,包括多叉和多级调整,再结合基于DOM格式目录树的模板文档进行遍历,完成所有自定义标签数据替换和属性变更,生成完整的模板文档文件,并计算遍历DOM目录树所耗费的时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网湖南省电力公司;国网湖南省电力公司经济技术研究院;湖南天下宽信息技术有限公司,未经国家电网公司;国网湖南省电力公司;国网湖南省电力公司经济技术研究院;湖南天下宽信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510822691.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:区分交互行为的方法及装置
- 下一篇:一种客户地址信息的分词处理方法和系统