[发明专利]一种PDF边界及网格线标识的方法及装置有效
申请号: | 201810023840.8 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108108339B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 王盛华;周祖胜 | 申请(专利权)人: | 北京仁和汇智信息技术有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/25 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 魏彦 |
地址: | 102200 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键区域 排版 位置参数 网格线 标尺 坐标信息 标注 | ||
本发明提供了PDF边界及网格线标识的方法及装置,其中,方法包括:对PDF文件进行预排版,在预排版的PDF文件上生成标尺层;基于标尺层中标注的PDF文件中的关键区域的坐标信息,判断关键区域的位置是否满足排版规则;如果不是,则进行调整关键区域的位置参数;基于调整后的位置参数对所述PDF文件进行排版。本发明与现有技术中的由人工进行估计关键区域的位置信息相比,其具有简单、便捷、准确的积极效果。
技术领域
本发明涉及排版系统技术领域,具体而言,涉及一种PDF边界及网格线标识的方法及装置。
背景技术
PDF(Portable Document Format的简称,意为“便携式文件格式”)是一种文件格式,它的优点在于跨平台、能保留文件原有格式(Layout)、开放标准,能自由授权(Royalty-free)自由开发PDF兼容软件,应用十分广泛。
现有技术中,在生成PDF文件的排版系统中,为了精确控制版式,操作员需要知道排出的PDF文件中每个关键区域的精确位置信息,如页面边界,栏目分割线,每行文字,每个图片等。现有技术中的常规做法是排版系统输出PDF文件时另外定制一个PDF阅读器,给阅读器加上一个类似办公软件word中的标尺功能,操作员需要时可以点击标尺上的刻度,阅读器画出通过该刻度的直线,操作人员根据这条线穿过区域的情况,人工判断关心的区域坐标,以此知道每个关键区域的位置信息,然后进行排版。这样的方式不够直观简洁,工作量大,精确性较低。
发明内容
有鉴于此,本发明的目的在于提供一种PDF边界及网格线标识的方法及装置,以解决上述问题。
第一方面,本发明实施例提供了一种PDF边界及网格线标识的方法,包括:
对PDF文件进行预排版,在预排版的PDF文件上生成标尺层;
基于所述标尺层中标注的所述PDF文件中的关键区域的坐标信息,判断所述关键区域的位置是否满足排版规则;
如果所述关键区域的位置不满足排版规则,则进行调整所述关键区域的位置参数;
基于调整后的位置参数对所述PDF文件进行排版。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述关键区域包括:文件中所包含的内容、文件的页眉、页脚和左右边空;其中,所述文件中所包含的内容包括:正文段落文字、图片、表格和公式。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述在预排版的PDF文件上生成标尺层,包括:
识别所述文件中所包含的关键区域;
根据确定的坐标原点,计算所述关键区域在PDF坐标系中的位置信息;
基于所述位置信息在所述关键区域的特定的位置处对所述关键区域进行标注;其中,所述标注的内容包括:坐标信息;
显示所述标注。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述显示所述标注,包括:
获取预设的标注样式信息,按照所述标注样式信息进行显示所述标注;
其中,所述标注样式信息包括:标注的线条格式、线条颜色和标注的文字字体、文字颜色及各间隔信息点标注。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述基于所述位置信息在特定的位置处对所述关键区域进行标注,包括:
在所述页眉与所述正文段落之间进行标注;
在所述正文段落与所述页脚之间进行标注;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京仁和汇智信息技术有限公司,未经北京仁和汇智信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810023840.8/2.html,转载请声明来源钻瓜专利网。