[发明专利]一种XML文件与PDF文件同步关联的方法及装置有效
申请号: | 201810023142.8 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108132920B | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 王盛华;周祖胜;李艳红 | 申请(专利权)人: | 北京仁和汇智信息技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/24;G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴开磊 |
地址: | 102200 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签标识符 关联 排版位置 标签 可扩展标记语言 标签设置 工作效率 排版过程 映射关系 文本段 构建 转换 申请 | ||
本申请提供一种XML文件与PDF文件同步关联的方法及装置,其中,该方法包括:为可扩展标记语言XML文件中的文本段标签设置对应的标签标识符;在所述XML文件转换为PDF文件的排版过程中,获取所述标签标识符;获取所述标签在所述PDF文件中的排版位置信息;构建所述标签标识符与所述排版位置信息的同步关联映射关系。通过该方法,使用户可以了解XML文件中的标签对应在PDF文件中的具体位置,实现XML文件与PDF文件的同步关联,增强使用方便性,提高工作效率。
技术领域
本申请涉及XML技术领域,尤其涉及一种XML文件与PDF文件同步关联的方法及装置。
背景技术
现有技术中,各排版系统采用自身的编辑器进行内容编辑,并通过排版引擎生成PDF文件,这项工作主要应用场景是用户通过PDF进行阅读,通过XML(Extensible MarkupLanguage,可扩展标记语言)编辑器进行内容编辑,这一方式的局限性是我们不能直接通过PDF来定位到需要编辑修改的内容,而是通过打开编辑器,在编辑器里定位修改后再生成PDF,也就是说PDF只起到了阅读的作用,没有提供辅助修改上的快速定位功能。
也就是说,原来的普遍方式是,通过排版系统从XML文件生成PDF文件,用户在阅读PDF文件的过程中若发现需要更改的文本,则需打开XML文件,通过逐行浏览XML文件的源码对需要更改的文本进行查找,在查找到对应的文本后进行修改,并重新生成PDF文件。
但是,由于排版系统只能进行文件格式转换,用户在查看PDF文件时不能直接跳转到XML文件中对应的源码进行修改,即不能了解XML文件的源码与PDF文件中的文本的对应关系,导致修改时操作步骤复杂,效率低的问题。
发明内容
有鉴于此,本申请实施例提供一种XML文件与PDF文件同步关联的方法,以解决现有技术中不能了解XML文件中的源码与PDF文件中的文本的对应关系而导致的修改时操作步骤复杂,效率低的问题。
第一方面,本申请实施例提供一种XML文件与PDF文件同步关联的方法,包括:
为可扩展标记语言XML文件中的文本段标签设置对应的标签标识符;
在所述XML文件转换为PDF文件的排版过程中,获取所述标签标识符;
获取所述标签在所述PDF文件中的排版位置信息;
构建所述标签标识符与所述排版位置信息的同步关联映射关系。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述排版位置信息包括:所述标签在所述PDF文件中的页码以及所在范围的边界坐标。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,获取所述标签在所述PDF文件中的排版位置信息包括:
记录所述标签在所述PDF文件中的页码;
获取所述标签在所述PDF文件中的起始行以及终止行;
基于所述起始行以及终止行确定所述所在范围;
依据确定的所在范围提取所述边界坐标。
结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,基于所述起始行以及终止行确定所述所在范围包括:
确定所述标签的最后一个字符在所述终止行中的位置;
依据所述起始行、所述起始行至所述终止行之间的中间行以及所述最后一个字符在所述终止行中的位置,确定所述标签标识符在所述PDF文件中的外形轮廓作为所述所在范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京仁和汇智信息技术有限公司,未经北京仁和汇智信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810023142.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页内容抽取的方法
- 下一篇:水电工程结构分解编码方法