[发明专利]一种对多文档图像分割的方法及介质有效
申请号: | 202010479205.8 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111652117B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 周曲;周异;陈凯;何建华 | 申请(专利权)人: | 上海深杳智能科技有限公司;厦门商集网络科技有限责任公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/14;G06V30/148;G06V30/18;G06V30/19;G06N3/0464;G06N3/084 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 200240 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 图像 分割 方法 介质 | ||
1.一种对多文档图像分割的方法,其特征在于,包括:
图像分割步骤:对待处理文档图像进行分割,得到分割结果;
分割结果审查步骤:对分割结果进行分割结果审查;
所述分割结果审查包括机器审查,通过机器对分割结果进行审查,得到审查结果,并根据所述审查结果判定分割结果是否符合预设要求;
所述机器审查包括如下任一种或任多种审查方式,包括:
置信度机器审查:根据深度学习模型输出的置信度信息进行机器审查;
多模型机器审查:利用多个预训练的深度学习模型进行机器审查;
文本检测机器审查:基于文本检测结果进行机器审查;
所述多模型机器审查包括:利用多个预训练的深度学习模型,分别对需要处理的多文档图像进行分割,得到各自的分割结果;通过对不同模型输出的分割结果进行比较,判断机器分割结果是否正确;
所述多个预训练的深度学习模型包括:具有不同深度的、不同网络结构的深度学习模型,其中,所述多个预训练的深度学习模型之间的训练数据集相同、均不同或者部分不同;
所述文档分割步骤包括:
采用有监督的基于卷积神经网络的深度学习模型,先对深度学习模型进行训练,再从待处理文档图像中分割出单个文档;
所述文档审查包括人工审查,在待处理文档图像中标注出分割得到的各个文档的轮廓,或将分割出来的各个文档单独另存为新的文档,并接收人工审查结果的输入信息;
其中,所述人工审查结果的输入信息包括:审查被分割出来的各个文档是否有遗漏未被分割的地方;或者被分割出来的各个文档是否包括不属于待处理文档图像的内容;或者被分割出来的各个文档有部分属于待处理文档图像的内容但未按照预设规则切割;或者审核结果无误;
若人工审查结果无误,则停止对待处理文档图像进行分割;
若人工审查结果有误,则对待处理文档图像的分割结果进行纠错:
--对未被分割出来的单个文档,找到相应的待处理文档图像,提供给人工分割文档;
--对于已经被机器分割出来,但分割出的轮廓不符合预设规则的单个文档,对分割出来的轮廓进行修正;
对多个人工审查结果进行审查和纠错,或者多轮审查和纠错。
2.根据权利要求1所述的对多文档图像分割的方法,其特征在于,所述置信度机器审查包括:根据深度学习模型输出的置信度信息所包含的单个文档分割的置信度,计算出文档图像分割的综合置信度;将文档图像分割的综合置信度与预先设置的阈值进行比较,确定机器分割结果是否正确。
3.根据权利要求1所述的对多文档图像分割的方法,其特征在于,所述文本检测机器审查包括:
对所述待处理文档图像进行分割,得到一个或多个的单个文档,并得到各个文档的轮廓作为分割结果;
所述文本检测机器审查,还包括:
--基于机器对待处理文档图像中的文字进行检测,得到文字定位信息,根据所述文字定位信息判断对应的文字是否位于文档的轮廓中,若位于,则判定分割结果正确;否则,则判定分割结果错误;
--基于机器对待处理文档图像中的文字进行检测,得到文字信息,判断所述文字信息与文档轮廓相应位置处的文字是否一致;若一致,则判定分割结果正确;否则,则判定分割结果错误。
4.根据权利要求2所述的对多文档图像分割的方法,其特征在于,所述置信度的计算包括:
通过预训练的深度学习模型分割多文档图像得到的每个单个文档的目标置信度和/或定位置信度,根据单个文档的目标置信度和/或定位置信度,计算整个多文档图像分割的置信度;
通过深度学习模型对多文档图像进行分割,得到N个单个文档,深度学习输出每个文档对应的目标置信度On和定位置信度Ln,第n个单个文档的置信度为Cn,公式为:Cn=min(On,Ln);
其中,min(x,y)函数计算x和y之间的最小值;n=1,2,…,N;
计算整个多文档图像的置信度C,表达式为:C=min(C1,C2,…,Cn,…,CN),n=1,2,…,N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海深杳智能科技有限公司;厦门商集网络科技有限责任公司,未经上海深杳智能科技有限公司;厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479205.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序