[发明专利]一种影印PDF转可复制PDF方法及系统在审
申请号: | 202210517186.2 | 申请日: | 2022-05-13 |
公开(公告)号: | CN114926840A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 孙俊;苟刚 | 申请(专利权)人: | 贵州大学 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/413;G06V30/414 |
代理公司: | 上海德誉达专利代理事务所(普通合伙) 31426 | 代理人: | 曹翠翠 |
地址: | 550025 贵州省*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 影印 pdf 复制 方法 系统 | ||
1.一种影印PDF转可复制PDF方法,其特征在于,包括步骤:
S1、载入代转换PDF文档数据,提取其中的格式信息,转数值为对应的像素分辨率,使用fitz工具提取每页图片,放大分辨率并提升清晰度;
S2、对每一张图片进行笛卡尔坐标系统转换到极坐标霍夫空间系统的直线霍夫变换,对图片进行可能的位置纠正;
S3、创建新的空白PDF,使用探测层对每一页进行文本位置区域探测,保留区域位置信息,使用识别模型识别每页的文本区域块,生成对应的文本信息;
S4、在新创建的PDF上使用一层Canvas,保留排版地把文本以确定的字体大小写上,然后附上每一张对应图片。
2.根据权利要求1所述的一种影印PDF转可复制PDF方法,其特征在于,所述步骤S1进一步的,包括以下步骤:
S11、导入待处理PDF文档数据;
S12、根据PDF格式的结构,提取出布局信息,如实际尺寸;
S13、转此规格下数值为对应的像素分辨率,不同dpi下参数意义不同,需要数值归一化;
S14、使用fitz工具把每页PDF转成图片,并放大分辨率,提升清晰度。
3.根据权利要求2所述的一种影印PDF转可复制PDF方法及系统,其特征在于:所述步骤S13对不同文档的单位转换和步骤S14对PDF进行切分并生成图片。
4.根据权利要求3所述的一种影印PDF转可复制PDF方法及系统,其特征在于,所述步骤S2进一步的,包括以下步骤:
S21、已经生成的图片进行灰度转换;
S22、通过霍夫变换检测直线,设置一般的检测阈值,由于图像不同,阈值不好设定,阈值设定过高会导致无法检测直线;
S23、依次画出每条线段,所画出的所有线条,只选角度最小的作为旋转角度,对所有角度求平均,这样做旋转效果会更稳定。
5.根据权利要求4所述的一种影印PDF转可复制PDF方法及系统,其特征在于:所述步骤S22通过选择合适地由大到小候选阈值设置,以对不同的图片设置一个较合理的阈值进行直线检测。
6.根据权利要求1所述的一种影印PDF转可复制PDF方法及系统,其特征在于,所述步骤S3进一步的,包括以下步骤:
S31、按照图片的像素尺寸以dpi=300下的PDF制式创建空白PDF;
S32、通过模块检测标注技术划分出所有可能的四边形文本块,记录位置信息,截取出这些小片段;通过一定dpi下像素和字体大小的转换得到文本的字体大小信息;
S33、使用OCR技术识别图片片段,使用构造的数据结构以保留位置信息对应的文本信息和字体大小。
7.根据权利要求6所述的一种影印PDF转可复制PDF方法及系统,其特征在于:所述步骤S32使用基于深度学习网络的光学图像转文字技术,并把图片信息与文本排版信息结合。
8.根据权利要求7所述的一种影印PDF转可复制PDF方法及系统,其特征在于,所述步骤S4进一步的,包括以下步骤:
S41、添加一层画布Canvas层;
S42、使用已存储信息,在对应位置上按字依次以具体字体大小写入对应的文本信息;
S43、以对应每页的图像覆盖文字层,保留原有的信息量。
9.一种影印PDF转可复制PDF系统,其特征在于,包括:
数据处理主模块:用于引入文件路径,导入原影印型PDF的数据,并传送、接收各模块请求,进行系统功能开始前的文档信息读入等准备工作;
尺度转换模块:根据原影印型PDF的尺寸格式,按照转换公式和设定好的参数进行相对尺寸单位转换,这是排版基本一致的重要前提;
文档切分模块:对影印型PDF的数据层进行拆分出页面图片,可以使用多种工具实现,模块使用fitz拆分页面,并结合尺度转换模块的布局数值信息进行常用的图片分辨率转换,把小分辨率图片进行提升,提高识别的准确率;
图形纠正模块:对页面图片进行灰度转换、二值化等处理后,像素数据对应在笛卡尔坐标系下,通过极坐标霍夫变换进行基本的倾斜的纠正,为后续的边界探测、文本识别提供合适的图形数据;
文本边界探测模块:该模块定位出输入图像中的四边形文字区域,以采用基于回归的算法,通过设定anchor回归检测框,取得可能的文本区域边界位置信息,并标注文本区域,由于图像的位置以此页面ppi下像素位置,仍需尺度转换对应在PDF的位置;
识别处理模块:对标注文本区域进行文本识别,并通过尺度转换和设定在系统中的公式计算图像中文本的字体大小;
图层写入模块:基于尺度变换模块的布局信息、文本边界探测模块的文本边界信息和识别处理模块的文本信息及字体大小,新建空白PDF以这些排版格式写入文字层,附加页面图片得到保留排版且可复制PDF。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210517186.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自清洁的环保型印刷设备
- 下一篇:一种生活用纸生产用混合装置