[发明专利]干扰去除方法、装置、计算机设备和存储介质在审
申请号: | 202010110719.6 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111291704A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 周康明;王庆峰 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 杨欢 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 干扰 去除 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种干扰去除方法、装置、计算机设备和存储介质。所述方法包括:获取待审数据图像;所述待审数据图像上包括干扰信息;在所述待审数据图像上对所述干扰信息进行提取处理,得到干扰信息图像;基于所述待审数据图像的背景对所述干扰信息图像进行处理,得到去除干扰的数据图像。采用本方法能够提高报表内容的识别准确度。
技术领域
本申请涉及图像处理技术领域,特别是涉及一种干扰去除方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的不断发展,银行的很多报表审核工作都实现了电子化、在线化处理,这样极大地提高了银行工作人员的工作效率。银行在对报表进行审核时,通常是采用文字识别算法(例如神经网络算法)对报表上的字符进行识别,得到报表上的内容,之后通过将识别的报表内容和预设的报表内容进行匹配,根据匹配结果完成对报表的审核。
但是,在实际使用过程中,由于每份报表上都需要签名,而签名所采用的签字笔的色彩和报表上字符的颜色十分接近,这样在采用文字识别算法对报表上的字符进行识别时,就很容易出现误识别的问题,例如将签字内容识别为报表内容,从而导致报表内容的识别准确度不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高报表内容识别准确度的干扰去除方法、装置、计算机设备和存储介质。
一种干扰去除方法,该方法包括:
获取待审数据图像;该待审数据图像上包括干扰信息;
在待审数据图像上对干扰信息进行提取处理,得到干扰信息图像;
基于待审数据图像的背景对干扰信息图像进行处理,得到去除干扰的数据图像。
在其中一个实施例中,上述基于待审数据图像的背景对干扰信息图像进行处理,得到去除干扰的数据图像,包括:
获取待审数据图像的背景的像素值;
将干扰信息图像上的各个像素值均替换为背景的像素值,得到去除干扰的数据图像;
或者,获取预设像素值;该预设像素值和待审数据图像的背景的像素值不同;
将待审数据图像的背景的像素值和干扰信息图像的像素值均替换为预设像素值。
在其中一个实施例中,上述在待审数据图像上对干扰信息进行提取处理,得到干扰信息图像,包括:
将待审数据图像输入至预设的图像分割模型中进行提取处理,得到干扰信息的图像。
在其中一个实施例中,上述图像分割模型的训练方法包括:
获取训练样本图像集;该训练样本图像集包括至少一个样本数据图像和样本数据图像对应的样本干扰信息图像;
基于训练样本图像集对初始图像分割模型进行训练,得到图像分割模型。
在其中一个实施例中,上述获取训练样本图像集,包括:
对不同形式手写的干扰信息进行图像采集,得到多个第一干扰信息图像;
将第一干扰信息图像叠加到多个历史数据图像中,得到多个叠加数据图像;
将叠加数据图像和对应的历史数据图像进行作差处理,得到第二干扰信息图像;
将叠加数据图像作为样本数据图像,以及将对应的第二干扰信息图像作为样本干扰信息图像,得到训练样本图像集。
在其中一个实施例中,上述基于训练样本图像集对初始图像分割模型进行训练,得到图像分割模型,包括:
将样本数据图像输入至初始图像分割模型,得到样本数据图像对应的预测干扰信息图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110719.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:出风组件、空调器
- 下一篇:热泵系统、热泵系统的控制方法和可读存储介质