[发明专利]基于生成对抗网络的老旧图纸修复方法在审
申请号: | 202111517567.2 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114220105A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张萌 | 申请(专利权)人: | 南京机电职业技术学院 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/19;G06K9/62;G06T5/00;G06T7/11;G06T7/12;G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 江苏致邦律师事务所 32230 | 代理人: | 尹妍;徐蓓 |
地址: | 211306 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 图纸 修复 方法 | ||
1.基于生成对抗网络的老旧图纸修复方法,其特征在于,包括:
(1)搜集可清晰阅读的图纸并案统一分辨率扫描成数字图像,分别进行下述处理:
A. 将数字图像分割后,采用一种或多种方法进行模糊处理,基于原数字图像和模糊处理后的数字图像构建第一训练集,训练第一生成对抗网络模型;
B. 将数字图像分割后,对分割好的图片利用标注框定位文本区域,作为文本检测识别模型的训练集训练文本检测识别模型;
利用所述标注框将文本自数字图像中分割出来,形成多个以文本为主的子图像;
采用一种或多种方法对子图像进行模糊处理,基于原子图像和模糊处理后的子图像构建第二训练集,训练第二生成对抗网络模型;
(2)获取需要修复的老旧图纸并扫描成数字图像,按和A中同样的方式分割后,将分割后的数字图像输入第一生成对抗网络模型,将第一生成对抗网络模型输出的结果拼合成原尺寸的数字图像;
(3)获取需要修复的老旧图纸并扫描成数字图像,按和B中同样的方式分割后,输入文本检测识别模型以利用标注框将文本自数字图像中分割出来,将获得的以文本为主的子图像输入第二生成对抗网络模型,将第二生成对抗网络模型输出的结果与(2)中获取的结果合并,获取修复的老旧图纸。
2.根据权利要求1所述的方法,其特征在于,所述(1)、(2)中,利用分割后的图像构建训练集之前,计算图像中图形像素的覆盖率,将覆盖率达到预设阈值的图像用于构建训练集。
3.根据权利要求2所述的方法,其特征在于,计算图像中图形像素的覆盖率的方法为:将图像进行二值化处理后,计算黑色像素占图像总像素数的比率作为覆盖率。
4.根据权利要求1所述的方法,其特征在于,所述模糊处理的方法包括插值放大、高斯模糊、随机增加噪点中的一种或多种;优选采用插值放大和随机增加噪点的方式对分割后的数字图像进行模糊处理。
5.根据权利要求2或3所述的方法,其特征在于,根据图像中图形像素的覆盖率进行不同程度的模糊处理。
6.根据权利要求2或3所述的方法,其特征在于,所述(2)、(3)中,根据覆盖率对图纸进行分割,分割后的图片覆盖率与训练集一致或接近。
7.根据权利要求1所述的方法,其特征在于,所述B中,将数字图像分割时,分割的子数字图像边缘之间设有重叠区域。
8.根据权利要求1所述的方法,其特征在于,所述(1)、(2)中,利用增强型超分辨率生成对抗网络(ESRGAN)进行模型训练。
9. 根据权利要求1或7所述的方法,其特征在于,所述(2)中,利用Mask TextSpotter网络进行文本检测识别。
10.根据权利要求1所述的方法,其特征在于,还包括,对第二生成对抗网络模型输出的结果,利用OCR模型提取出文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京机电职业技术学院,未经南京机电职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111517567.2/1.html,转载请声明来源钻瓜专利网。