[发明专利]一种证件类图片的关键文本检测、分类训练方法有效
申请号: | 202110853791.2 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113343990B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 黎嘉朗;张翊;吴名朝 | 申请(专利权)人: | 浩鲸云计算科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 | 代理人: | 孙丽君 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 证件 图片 关键 文本 检测 分类 训练 方法 | ||
本发明公开了一种证件类图片的关键文本检测、分类训练方法,该方法包括以下步骤:S1、构建证件模板,并基于证件模板生成训练样本;S2、构建文字检测及分类一体算法模型,并基于网络输出的检测特征图和分类特征图输出文本区域及其分类结果;S3、将训练样本导入文字检测及分类一体算法模型进行训练,并在训练过程中分别对分类特征图、检测预测特征图进行两类负采样;S4、依次计算分类特征图中的分类特征图损失值和检测预测特征图中的检测预测特征图损失值,并融合分类特征图损失值和检测预测特征图损失值进行反向传播优化训练文字检测及分类一体算法模型。有益效果:收集少量样本即可支撑深度神经网络的训练。
技术领域
本发明涉及文字检测技术领域,具体来说,涉及一种证件类图片的关键文本检测、分类训练方法。
背景技术
证件类图片的文字识别场景需要从图片中提取感兴趣区域的文字内容并对其进行分类划分到对应的字段上,通常的做法有两种:1、结合通用文字检测、通用文字识别得到图片中所有文字的位置及内容后,基于不同字段的内容规则将识别结果划分到对应的内容字段上;2、基于模板参考位置提取感兴趣区域,先在模板上标定多个参考位置,在实际运行时先找出图片中的参考位置后,在进行文字检测,结合文字检测得到的坐标信息和参考位置判断各个文本框属于哪一个字段。
前者的主要问题是在字段划分阶段涉及大量文本规则的编写、部分字段的文字内容无明显规则、实际场景中存在大量噪声导致整体的关键文本检测、分类的结果不可靠;后者则对参考位置的依赖性大,当存在参考位置缺失、图片存在形变等情况时,字段分类结果不可靠。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种证件类图片的关键文本检测、分类训练方法,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
一种证件类图片的关键文本检测、分类训练方法,该方法包括以下步骤:
S1、构建证件模板,并基于证件模板生成训练样本;
S2、在基于图像分割方式的文本检测神经网络模型基础上引入分类分支,构建文字检测及分类一体算法模型,并基于网络输出的检测特征图和分类特征图输出文本区域及其分类结果;
S3、将训练样本导入文字检测及分类一体算法模型进行训练,并在训练过程中分别对分类特征图、检测特征图进行两类负采样;
S4、依次计算分类特征图中的分类特征图损失值和检测特征图中的检测特征图损失值,并融合分类特征图损失值和检测特征图损失值进行反向传播优化训练文字检测及分类一体算法模型。
进一步的,所述构建证件模板,并基于证件模板生成训练样本还包括以下步骤:
S11、使用图片标注工具对图像中需要检测的文字区域进行标注,并标注文本区域中对应的字段名称,得到模板图片的标注文件;
S12、使用图片编辑工具、对抗生成网络方法擦除模板图片的文字内容,得到待填充内容的模板图片;
S13、各个字段定制不同的文本内容生成规则,采用文本内容生成规则将不同的字体、字号、颜色填充到对应字段的位置区域上的随机位置上,对生成的图片进行全局性的图像增强,并生成其对应的标注文件。
进一步的,所述使用图片标注工具对图像中需要检测的文字区域进行标注,并标注文本区域中对应的字段名称,得到模板图片的标注文件还包括以下步骤:
S111、基于图像标注工具,对图像中需要检测的文字区域进行逐行标注;
S112、标注文本区域对应的字段名称,得到图像中所有待检测区域的位置并对标注的字段标识对应分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浩鲸云计算科技股份有限公司,未经浩鲸云计算科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110853791.2/2.html,转载请声明来源钻瓜专利网。