[发明专利]基于版式文件的文档流式信息处理方法及装置有效
申请号: | 200810114437.2 | 申请日: | 2008-06-05 |
公开(公告)号: | CN101308488A | 公开(公告)日: | 2008-11-19 |
发明(设计)人: | 仇睿恒;王毅;汤帜 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F17/21 | 分类号: | G06F17/21 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 黄志华 |
地址: | 100871北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 版式 文件 文档 信息处理 方法 装置 | ||
技术领域
本发明涉及计算机信息处理技术领域,特别涉及基于版式文件的文档流式信息处理方法及装置。
背景技术
版式文件采用一种绝对描述方式,在自定义的坐标系中,明确记录了每个文档显示的位置和尺寸等,从而使文档打印出来的结果和在计算机上浏览的结果一致,而且在任何计算机环境下具有显示一致性的特点,以保证真实地重现文档的原貌,例如目前的PDF文件就是一种比较典型的版式文件。由于版式文件的相对稳定性,因此非常适合作为电子文档的最终发布和传播形式,广泛用于电子公文、电子书、电子期刊、电子报纸等领域。
随着计算机技术的普及和信息技术的发展,版式文件的数量呈现爆炸性增长,同时目前客户端种类增多,例如PDA、智能手机等,用户要求在多种客户端上都能够方便的阅读版式文件,这就要求客户端能够突破版式文件显示固定的局限性,根据显示设备屏幕的大小对版式文件的内容重新进行排版。同时由于版式文件用绝对数值精确指定每个文档显示的位置和尺寸,使得它不利于编辑,每次修改文档内容后都需要对布局重新计算,重写整个文档的布局信息,因此对版式文件内容的检索、结构化存储、修改、提取等编辑操作都会非常麻烦。
对版式文件进行排版和重新排版处理都需要参照版式文件中的文档流式信息,其中文档流式信息包含文档结构信息、阅读线索和版面信息等,然而目前大量的版式文件中都还不包含这类文档流式信息。
发明内容
有鉴于此,本发明提供一种基于版式文件的文档流式信息处理方法及装置,用以切实可行的描述版式文件的文档流式信息,并使版式文件的文档流式信息描述简化。
本发明提供以下技术方案:
一种基于版式文件的文档流式信息处理方法,包括步骤:
获得版式文件的文档流式信息,所述文档流式信息为所述版式文件中文档内容结构信息和/或所述版式文件中文档版面自适应呈现信息;
根据所述获得的文档流式信息,对所述版式文件的文档内容进行内容块划分;
描述所述版式文件的内容块划分结果信息;
根据所述内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息,其中描述基于内容块划分后的该版式文件的文档流式信息,是指描述各内容块本身的文档流式信息和各内容块之间的关系。
一种基于版式文件的文档流式信息处理装置,包括:
文档流式信息获得模块,用于获得版式文件的文档流式信息,所述文档流式信息为所述版式文件中文档内容结构信息和/或所述版式文件中文档版面自适应呈现信息;
内容块划分模块,用于根据所述获得的文档流式信息,对所述版式文件的文档内容进行内容块划分;
内容块划分结果信息描述模块,用于描述所述版式文件的内容块划分结果信息;
文档流式信息描述模块,用于根据所述内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息,其中描述基于内容块划分后的该版式文件的文档流式信息,是指描述各内容块本身的文档流式信息和各内容块之间的关系。
本发明有益效果如下:
本发明提供的技术方案通过获得版式文件的文档流式信息,根据获得的文档流式信息,对版式文件的文档内容进行内容块划分,描述内容块划分结果信息,根据内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息,使得描述版式文件的文档流式信息更加切实可行,可以灵活对版式文件中的任意内容进行文档流式信息的描述,描述范围更加准确,并且文档流式信息的处理更加灵活、简化。
附图说明
图1为本发明实施例中,基于版式文件的文档流式信息处理方法流程示意图;
图2为本发明实施例中,描述基于内容块划分后的版式文件的文档流式信息示意图;
图3为本发明实施例中,版式文件及其内容描述示意图;
图4为本发明实施例中,图3所示版式文件的内容块划分方式示意图;
图5为本发明实施例中,描述图3所示版式文件的内容块划分结果信息示意图;
图6为本发明实施例中,图3所示版式文件划分内容块后的文档流式信息中的文档结构信息示意图;
图7为本发明实施例中,图3所示版式文件划分内容块后的文档流式信息中的文档版面自适应呈现信息示意图;
图8为本发明实施例中,基于版式文件的文档流式信息处理装置结构示意图;
图9为本发明实施例中,采用划分内容参考序列的方法对版式文件的文档内容进行内容块划分示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810114437.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具测试架构的液晶显示装置及相关测试方法
- 下一篇:瓜果肠及其生产方法