[发明专利]复杂文档分离组织方法以及复杂文档自动生成方法有效
申请号: | 201510064618.9 | 申请日: | 2015-02-06 |
公开(公告)号: | CN104598636B | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | 董国良;吴利;董超群;黄东海 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
代理公司: | 北京众合诚成知识产权代理有限公司11246 | 代理人: | 龚燮英 |
地址: | 214083 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了复杂文档分离组织方法以及复杂文档自动生成方法。该复杂文档分离组织方法包括将复杂文档分解成文档大纲、文档数据和文档样式;其中将复杂文档的文档大纲定义为对文档结构的宏观描述,是按照文档内容对文档的层次化分解、定义和管理,是对文档数据和文档样式模板的统一组织;复杂文档的文档数据是对文档元数据的组织和描述;复杂文档的文档样式是对文档样式的组织和描述。 | ||
搜索关键词: | 复杂 文档 分离 组织 方法 以及 自动 生成 | ||
【主权项】:
一种复杂文档自动生成方法,其特征在于包括:将复杂文档分解成文档大纲、文档数据和文档样式;其中将复杂文档的文档大纲定义为对文档结构的宏观描述,是按照文档内容对文档的层次化分解、定义和管理,是对文档数据和文档样式模板的统一组织;复杂文档的文档数据是对文档元数据的组织和描述;复杂文档的文档样式是对文档样式的组织和描述;文档大纲包括文档架构描述、文档关联索引、文档数据模板定义、文档样式模板定义和文档属性定义;文档架构描述是按照内容对整个文档进行层次化分解和组织,为文档主体框架的静态展现;文档关联索引定义文档层次与元素间的引用和关联关系,将文档架构的各个组成部分进行有机融合;文档数据模板定义是文档数据模板的入口,描述了文档数据相关模板的获取方法;文档样式模板定义是文档样式模板的入口,描述了文档样式相关模板的获取方法;文档属性定义包含文档的全局的、通用的属性描述,可以在文档的相关数据和样式模板中进行引用;文档数据包括文档具体内容、文档内容分组、文档内容与样式关联;文档具体内容是文档需要实际展现的数据,是对原始数据的处理和组织;文档内容分组是在文档大纲的宏观组织下,进一步细化对文档内容的组织,或者是粗粒度的文档内容;文档内容分组包括封面、目录页、正文、附录;文档内容与样式关联是确定文档具体内容最终输出的样式;文档内容与样式关联具有间接关系,文档内容所属的文档内容分组与一个文档内容样式索引进行关联,文档具体内容通过引用文档内容样式索引的序号间接地与文档具体内容样式进行关联;文档样式包括文档整体样式、文档结构样式、文档内容样式和文档内容样式索引;文档整体样式针对于整个文档设置的样式,包括文字处理类文档中的页眉页脚、演示文稿类文档中的母版设置;文档结构样式针对于文档结构层次设置的样式,包括文字处理类文档中的分节;文档内容样式针对于上文提到的文档具体内容设置的样式,包括表格样式、段落样式、编号样式、字体样式;文档内容样式索引分组地对文档内容样式进行编排,文档内容通过引用内容样式序号间接地与内容样式进行关联;而且,所述复杂文档自动生成方法包括下述步骤:首先,执行第一步骤以获取文档大纲模板描述;随后,执行第二步骤以便对文档大纲模板进行解析;其中在第二步骤中,根据文档数据模板定义信息和文档样式模板定义信息控制进行第三步骤、第四步骤和第五步骤以完成文档相关数据和样式模板的获取;随后,根据文档架构描述和关联索引信息控制第六步骤、第七步骤和第八步骤以完成文档数据获取及其格式的转换;接着,根据文档内容与样式关联信息执行第九步骤和第十步骤以完成文档数据与样式的匹配及组装,最后根据文档的完成情况进入第十一步骤以完成最终文档的输出;其中,第三步骤用于获取文档数据组模板,文档数据组模板描述了文档内容的组合和获取方法以及文档内容分组的样式索引;第四步骤用于获取文档样式组模板,文档样式组模板定义了文档内容样式索引,并且对文档内容样式的具体标识进行了编排;第五步骤用于获取文档的属性模板;其中,第六步骤用于根据文档大纲模板中文档架构描述和关联索引信息涉及的宏观的文档内容分组信息,从第三步骤获取到的文档数据组模板中提取相应的文档内容分组描述并进行解析,获取文档内容数据的模板信息;第七步骤用于根据第六步骤获取到的文档内容数据的模板信息,获取文档数据模板;第八步骤用于根据第七步骤获取到的文档数据模板,获取原始数据,并将原始数据进行格式转换;第九步骤用于将第八步骤格式转换后的文档数据与第四步骤获取到文档内容样式索引进行关联分析,根据文档内容分组关联的文档内容样式索引,以及文档具体内容关联的文档内容样式索引序号,将格式转换后的文档数据中的文档具体内容与具体的文档内容样式标识进行匹配;第十步骤用于将第九步骤样式匹配后的文档数据与第五步获取到的各类文档样式进行组装,第十一步骤用于根据文档格式需求,将组装好的带样式的文档数据进行格式化输出,形成最终文档。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510064618.9/,转载请声明来源钻瓜专利网。