[发明专利]一种票据图像中印章与背景文字分离方法有效

专利信息
申请号: 201910835331.X 申请日: 2019-09-05
公开(公告)号: CN110619642B 公开(公告)日: 2022-02-01
发明(设计)人: 王俊峰;高琳;唐鹏;李征 申请(专利权)人: 四川大学
主分类号: G06T7/11 分类号: G06T7/11;G06T7/136;G06T7/194;G06T7/90
代理公司: 成都禾创知家知识产权代理有限公司 51284 代理人: 裴娟
地址: 610065 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 票据 图像 印章 背景 文字 分离 方法
【说明书】:

发明公开了一种票据图像中印章与背景文字分离方法,首先,采集含有印章的票据图像建立票据印章数据集;然后利用标注数据集对基于卷积神经网络的目标检测模型进行训练;其次,训练的模型检测定位出印章图像区域;接着,将提取出的印章图像进行色彩空间变换;通过数字图像盲源分离,将图像中的印章与背景文字进行分离;最后对分离后的印章和背景文字图像进行图像分割,得到最终结果图像。本发明对光照不均、噪声干扰等复杂情况具有较好的鲁棒性,具有较好的普遍适用性,适用于任意颜色或形状的印章以及背景文字,能够准确地分离出印章和背景文字,同时保留印章中的信息和背景文字信息,提升票据字符识别的准确性和可靠性。

技术领域

本发明属于计算机数字图像处理领域,特别是一种票据图像中印章与背景文字分离方法。

背景技术

票据是企业或个人在商业活动中的交易凭证,随着我国经济的快速发展,票据产生的数量也在急剧上升。目前普遍应用的财务数据信息化管理系统,为票据信息的查询和管理提供了极大的便利,这些票据信息中有相当一部分是从纸质票据上采集得到的。传统的采集方式是通过财务人员手工录入完成,由于信息量巨大,需要投入大量的人工,同时由于人工录入的可靠性无法保障,还需要花费很多人力进行后期校对。随着对财务信息化管理能力的进一步提高,对票据信息录入的准确性和录入效率也有更高的要求。利用数字图像识别技术,能够快速准确地定位和提取票据字符,通过字符识别获得票据信息并自动完成录入,大大提高了信息录入的工作效率,在减少人力物力投入的同时,降低了人工操作作所造成的错误风险。

票据上一般都会盖上税务或财务部门的专用印章,有些印章加盖的位置并不固定,可能会将覆盖或重叠票据上的重要信息,这对于后续的字符识别造成严重干扰。为此,票据图像识别流程中,通常需要先恢复出印章所覆盖的信息后再进行识别。传统的去除印章方法是假定印章和票据文字具有不同的颜色,通过分离出颜色通道,将印章和票据文字区分开。但是,印章出现的颜色可能有很多种,并且同种颜色的印章也会由于油墨差异等原因,和标准颜色之间存在较大偏差,往往难以对印章颜色进行准确定义和量化。此外,印章本身也包含文字信息,这些信息对于财务人员也是同样需要的,仅仅去除印章并不能满足实际的需求,因此需要同时恢复出图像中的印章与背景文字。

发明内容

本发明所要解决的技术问题是提供一种票据图像中印章与背景文字分离方法,能够准确地分离出印章和背景文字,提升票据字符识别的准确性和可靠性,为后续的票据字符识别提供效的数据。

为解决上述技术问题,本发明采用的技术方案是:

一种票据图像中印章与背景文字分离方法,包括以下步骤:

步骤1:对采集的票据图像进行去噪处理,之后标注出印章在图像中的位置和尺寸,建立票据印章数据集;

步骤2:根据标注后的数据集,对基于卷积神经网络的目标检测模型进行训练,获得印章检测模型参数;

步骤3:利用训练好印章检测模型对待分离处理的票据图像进行检测,定位到票据图像中的印章区域,将印章区域数据提取出来;

步骤4:将提取出的印章区域进行颜色空间变换,获得变换后图像;

步骤5:通过数字图像的盲源分离,将变换后图像中的印章与背景文字进行分离,具体为:

步骤51:对色调、饱和度和亮度三个通道的印章区域,分别去均值,从印章区域中减去图像均值,使得图像像素值均值为零;

步骤52:然后对去均值后的图像进行白化处理,获得白化后的图像;

步骤53:对白化后的图像,利用独立分量提取方法分离出印章和背景文字;

步骤6:对分离后的印章和背景文字进行图像分割,去除背景物的干扰,得到最终图像。

进一步的,所述步骤1具体为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910835331.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top