[发明专利]一种PDF边界及网格线标识的方法及装置有效
申请号: | 201810023840.8 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108108339B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 王盛华;周祖胜 | 申请(专利权)人: | 北京仁和汇智信息技术有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/25 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 魏彦 |
地址: | 102200 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键区域 排版 位置参数 网格线 标尺 坐标信息 标注 | ||
1.一种PDF边界及网格线标识的方法,其特征在于,包括:
对PDF文件进行预排版,识别所述PDF文件中所包含的关键区域;
根据确定的坐标原点,计算所述关键区域在PDF坐标系中的位置信息;
基于所述位置信息在所述关键区域的特定的位置处对所述关键区域进行标注;其中,所述标注的内容包括:坐标信息;
显示所述标注;
基于标注的所述PDF文件中的关键区域的坐标信息,判断所述关键区域的位置是否满足排版规则;所述关键区域包括:PDF文件中所包含的内容、文件的页眉、页脚和左右边空;其中,所述PDF文件中所包含的内容包括:正文段落、图片、表格和公式;
如果所述关键区域的位置不满足排版规则,则进行调整所述关键区域的位置参数;
基于调整后的位置参数对所述PDF文件进行排版。
2.根据权利要求1所述的方法,其特征在于,所述显示所述标注,包括:
获取预设的标注样式信息,按照所述标注样式信息进行显示所述标注;
其中,所述标注样式信息包括:标注的线条格式、线条颜色和标注的文字字体、文字颜色及各间隔信息点标注。
3.根据权利要求1所述的方法,所述基于所述位置信息在特定的位置处对所述关键区域进行标注,包括:
在所述页眉与所述正文段落之间进行标注;
在所述正文段落与所述页脚之间进行标注;
在所述左右边空与所述正文段落之间进行标注;
在页面每栏的边界处进行标注;
在每个间隔信息点处进行标注。
4.根据权利要求1所述的方法,所述基于所述位置信息在特定的位置处对所述关键区域进行标注,还包括:
在每行文字的下方进行标注;
在每个图片的边框处进行标注;
在每个表格的边框处进行标注;
在每个独立成行的公式下方进行标注。
5.一种PDF边界及网格线标识的装置,其特征在于,包括:
标尺层生成模块,用于对PDF文件进行预排版,在预排版的PDF文件上生成标尺层;
判断模块,用于基于所述标尺层中标注的所述PDF文件中的关键区域的坐标信息,判断所述关键区域的位置是否满足排版规则;
调整模块,用于如果所述关键区域的位置不满足排版规则,进行调整所述关键区域的位置参数;
排版模块,用于基于调整后的位置参数对所述PDF文件进行排版;
其中,所述标尺层生成模块,包括:
识别单元,用于识别所述文件中所包含的关键区域;
计算单元,用于根据确定的坐标原点,计算所述关键区域在PDF坐标系中的位置信息;所述关键区域包括:PDF文件中所包含的内容、文件的页眉、页脚和左右边空;其中,所述PDF文件中所包含的内容包括:正文段落、图片、表格和公式;
标注单元,用于基于所述位置信息在所述关键区域的特定的位置处对所述关键区域进行标注;其中,所述标注的内容包括:坐标信息;
显示单元,用于显示所述标注。
6.根据权利要求5所述的装置,其特征在于,所述显示单元,具体用于:
获取预设的标注样式信息,按照所述标注样式信息进行显示所述标注;
其中,所述标注样式信息包括:标注的线条格式、线条颜色和标注的文字字体、文字颜色及各间隔信息点标注。
7.根据权利要求5所述的装置,其特征在于,所述标注单元具体用于:
在所述页眉与所述正文段落之间进行标注;
在所述正文段落与所述页脚之间进行标注;
在所述左右边空与所述正文段落之间进行标注;
在页面每栏的边界处进行标注;
在每个间隔信息点处进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京仁和汇智信息技术有限公司,未经北京仁和汇智信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810023840.8/1.html,转载请声明来源钻瓜专利网。