[发明专利]一种对多文档图像分割的方法及介质有效
申请号: | 202010479205.8 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111652117B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 周曲;周异;陈凯;何建华 | 申请(专利权)人: | 上海深杳智能科技有限公司;厦门商集网络科技有限责任公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/14;G06V30/148;G06V30/18;G06V30/19;G06N3/0464;G06N3/084 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 200240 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 图像 分割 方法 介质 | ||
本发明提供了一种对多文档图像分割的方法及介质,包括:图像分割步骤:对待处理文档图像进行分割,得到分割结果;分割结果审查步骤:对分割结果进行分割结果审查;所述分割结果审查包括机器审查,通过机器对分割结果进行审查,得到审查结果,并根据所述审查结果判定分割结果是否符合预设要求。本发明能有效提高文档图像多文档切分的准确度和处理速度,降低了人工参与和系统运维成本。
技术领域
本发明涉及文档处理技术领域,具体地,涉及一种对多文档图像分割的方法及介质。
背景技术
随着近几年来人工智能尤其是深度学习技术的快速发展,从文档图像中定位和识别文字的应用在准确度方面得到了非常大的提高,从而极大地推动了文档图像文字处理应用的自动化,在很多商业领域(比如财务报销和银行对账)已经取得一定的成功,具有巨大的商业潜力。但是这些应用系统面临一个文档切分的主要技术问题。用户在将纸张的文档(比如出租车票据/购物帐单等)转换成数字图像时,通常会将多张文档不规则地放在一起进行扫描或者拍照。这样得到的数字文档图像中通常包含多张独立的文档,不能直接输入给现有的基于深度学习的图像文档文字检测/识别处理系统进行处理。因此一个实际的图像文档处理系统必须要完成一个切分的任务,也即将单张图像中包含的单个的文档切割分离(切分)处理,并且可选地将单个的文档的方向调整为正常的方向和对每个单个的文档进行分类,使得每个单个的文档能够被图像文档检测/识别处理系统进行处理。
多文档图像切分是很多实际文档处理系统中很重要的一个环节。传统的文档切分方法,主要是采用人工进行切分,或者通过提取边缘对文档进行切分。人工切分的方法,成本高,系统处理容量有限,阻碍了实现文档处理系统的全自动化。提取边缘的文档切分方法的系统流程参见图1。这种方法可以通过机器实现,从而实现系统的全自动化。但是提取边缘的切分方法也有很多的不足,包括不够稳健(有些单个文档的边缘不清晰寻找不到正确/完整的边缘)、方法复杂(即使寻找到边缘后也还需要将边缘正确地匹配到单个文档上)、容易出错(包括边缘提取错误和边缘匹配错误等)、不能对单个文档进行调整和分类等问题。因此基于边缘提取的切分方法在切分准确度方面很难满足实际商业应用的要求。
针对提取边缘的多文档图像切分方法存在的问题,我们提出了一种新颖的文档切分方案,采用图像目标分割技术切割出单个的文档。该方案将不同的单个的文档直接作为待检测和分割的目标,利用传统方法或者深度学习技术来做目标检测和分割,从而有效提高多文档切分方法的速度和准确度等问题。基于图像目标分割技术的切分方法取得了很高的准确度,但是基于纯机器的图像目标分割技术的切分方法本身还存在准确度性能以及不能从低质量的图像有效切割文档等问题,对于很多具有高准确度要求的商业应用(比如很多金融财务和税务等业务要求99%以上的准确度),该方法还达不到应用的要求。另外,多文档图像切分任务处于整个文档处理系统的上游,一旦文档切分出现问题(比如图像中包含的文档里面有文档未被检测到,或者有文档被检测到但是部分内容没有被正确地包含到检测框里面),将对后面的文字检测与识别任务造成非常大甚至无法逆转的影响。
专利文献CN1687969A(申请号:200510011706.9)公开了基于文档图像内容分析与特征提取的文档图像压缩方法,它由文档图像预处理、文档图像分割、文字压缩和图像压缩步骤组成:其文档图像预处理对文档图像的灰度值进行统计并向图像边界投影,根据投影曲线边沿变化和灰度直方图分析文档图像内容并自动检测和提取出文档图像的特征信息,包括文字高度、图像边界和文档附带的标记的位置信息、象素灰度值信息等;文档图像分割根据文档图像预处理的结果,将文档图像分割成文字部分和图像部分且其颜色信息不受影响;文字压缩对分割出的文字部分进行灰度变换和行程编码予以压缩;图像压缩对分割出的图像部分进行基于离散余弦变换的有损压缩。
相比较传统的人工文档切分和纯基于机器切分的方法,本发明可以有效地解决现有方法中存在的主要问题,大幅度提高图像文档切分的速度、准确度、稳定度和可靠度,从而极大地提高文档处理系统的自动化程度,降低文档处理系统的成本,利于增加文档处理系统的规模并支持更多的用户。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海深杳智能科技有限公司;厦门商集网络科技有限责任公司,未经上海深杳智能科技有限公司;厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479205.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序