[发明专利]文档去噪方法、装置、设备和介质在审
申请号: | 202310525026.7 | 申请日: | 2023-05-10 |
公开(公告)号: | CN116580404A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张海轩 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V30/164 | 分类号: | G06V30/164;G06V10/82;G06V30/19;G06N3/0475;G06N3/0464 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 方法 装置 设备 介质 | ||
1.一种文档去噪方法,包括:
向训练好的融合网络模型输入第一文档图像,其中,所述融合网络模型包括编码模块和解码模块;
利用所述编码模块对所述第一文档图像进行特征压缩;以及
利用所述解码模块对所述编码模块的输出进行图像还原后输出第二文档图像,其中,所述第二文档图像用作光学字符识别系统的输入;
其中,所述编码模块包括至少一个卷积层,其中,所述卷积层包括区域生成网络和特征提取子网络;其中,所述利用所述编码模块对所述第一文档图像进行特征压缩包括:
利用所述区域生成网络在所述卷积层的输入特征图上通过滑动窗口产生搜索框,并对每个搜索框进行分类,所述分类包括冗余和不冗余两类;以及
利用所述特征提取子网络对分类到不冗余的类别中的搜索框进行特征提取,得到所述卷积层的输出特征图。
2.根据权利要求1所述的方法,其中,所述利用所述区域生成网络对每个搜索框进行分类包括:
基于非极大值抑制算法对每个搜索框进行分类。
3.根据权利要求1所述的方法,其中,所述利用所述特征提取子网络对分类到不冗余的类别中的搜索框进行特征提取包括:
利用感兴趣区域ROI子网络对所述分类到不冗余的类别中的搜索框,划分成与所述输出特征图的维度相同大小的部分,并将每个部分的最大值作为所述输出特征图中每个位置的输出。
4.根据权利要求1所述的方法,其中,所述利用所述编码模块对所述第一文档图像进行特征压缩包括:
通过密集连接,所述编码模块中除最后一个卷积层以外的每个卷积层,将该卷积层的输出输入到其后所有的卷积层中。
5.根据权利要求1~4任意一项所述的方法,其中,所述融合网络模型还包括空洞空间金字塔池化模块,在所述利用所述解码模块对所述编码模块的输出进行图像还原之前,所述方法还包括:
将所述编码模块的输出作为空洞空间金字塔池化模块的输入,利用所述空洞空间金字塔池化模块进行特征融合;以及
将所述空洞空间金字塔池化模块的输出,输入到所述解码模块。
6.根据权利要求5所述的方法,其中,所述融合网络模型还包括条件随机场,所述利用所述解码模块对所述编码模块的输出进行图像还原之后,所述方法还包括:
将所述解码模块的输出作为所述条件随机场的输入,利用所述条件随机场处理后输出所述第二文档图像。
7.根据权利要求1所述的方法,其中,所述方法还包括:
利用所述光学字符识别系统识别所述第二文档图像中的文字。
8.一种文档去噪装置,包括:
融合网络模型,用于接收输入的第一文档图像,对所述第一文档图像进行处理后输出第二文档图像,其中,所述第二文档图像用作光学字符识别系统的输入;
其中,所述融合网络模型包括编码模块和解码模块,
所述编码模块用于对所述第一文档图像进行特征压缩;以及
所述解码模块用于对所述编码模块的输出进行图像还原后输出所述第二文档图像;
其中,所述编码模块包括至少一个卷积层,其中,所述卷积层包括区域生成网络和特征提取子网络;
所述区域生成网络用于在所述卷积层的输入特征图上通过滑动窗口产生搜索框,并对每个搜索框进行分类,所述分类包括冗余和不冗余两类;
所述特征提取子网络用于对分类到不冗余的类别中的搜索框进行特征提取,得到所述卷积层的输出特征图。
9.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现权利要求1~7中任一项所述的方法。
11.一种计算机程序产品,包括计算机程序指令,所述计算机程序指令被处理器执行时实现权利要求1~7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310525026.7/1.html,转载请声明来源钻瓜专利网。