[发明专利]一种证件类图片的关键文本检测、分类训练方法有效

专利信息
申请号: 202110853791.2 申请日: 2021-07-28
公开(公告)号: CN113343990B 公开(公告)日: 2021-12-03
发明(设计)人: 黎嘉朗;张翊;吴名朝 申请(专利权)人: 浩鲸云计算科技股份有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34;G06K9/62;G06N3/04
代理公司: 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 代理人: 孙丽君
地址: 210000 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 证件 图片 关键 文本 检测 分类 训练 方法
【权利要求书】:

1.一种证件类图片的关键文本检测、分类训练方法,其特征在于,该方法包括以下步骤:

S1、构建证件模板,并基于证件模板生成训练样本;

S2、在基于图像分割方式的文本检测神经网络模型基础上引入分类分支,构建文字检测及分类一体算法模型,并基于网络输出的检测特征图和分类特征图输出文本区域及其分类结果;

S3、将训练样本导入文字检测及分类一体算法模型进行训练,并在训练过程中分别对分类特征图、检测特征图进行两类负采样;

S4、依次计算分类特征图中的分类特征图损失值和检测特征图中的检测特征图损失值,并融合分类特征图损失值和检测特征图损失值进行反向传播优化训练文字检测及分类一体算法模型;

其中,所述构建证件模板,并基于证件模板生成训练样本还包括以下步骤:

S11、使用图片标注工具对图像中需要检测的文字区域进行标注,并标注文本区域中对应的字段名称,得到模板图片的标注文件;

S12、使用图片编辑工具、对抗生成网络方法擦除模板图片的文字内容,得到待填充内容的模板图片;

S13、各个字段定制不同的文本内容生成规则,采用文本内容生成规则将不同的字体、字号、颜色填充到对应字段的位置区域上的随机位置上,对生成的图片进行全局性的图像增强,并生成其对应的标注文件;

所述使用图片标注工具对图像中需要检测的文字区域进行标注,并标注文本区域中对应的字段名称,得到模板图片的标注文件还包括以下步骤:

S111、基于图像标注工具,对图像中需要检测的文字区域进行逐行标注;

S112、标注文本区域对应的字段名称,得到图像中所有待检测区域的位置并对标注的字段标识对应分类。

2.根据权利要求1所述的一种证件类图片的关键文本检测、分类训练方法,其特征在于,所述文本内容生成规则还包括以下步骤:指定各个字段中文本规则,依据文本规则填充到标准生成模板,在对证件图片进行全局的填充。

3.根据权利要求1所述的一种证件类图片的关键文本检测、分类训练方法,其特征在于,所述在基于图像分割方式的文本检测神经网络模型基础上引入分类分支,构建文字检测及分类一体算法模型,并基于网络输出的检测特征图和分类特征图输出文本区域及其分类结果还包括以下步骤:

S21、改造文本检测神经网络的结构:设待检测模板存在数类分类字段,文本检测网络根据结构分为骨干层和检测层,保持骨干层结构不变并进行改造;

S22、基于检测特征图和分类特征图输出文本区域及其分类结果:设网络输出分类特征图与检测特征图,基于检测特征图通过轮廓提取、生成最小包围盒的方法得到多个文本区域包围盒及其对应的置信度,并通过非极大值抑制过滤得到检测框集合,检测框集合可对应于所有分类特征图的对应位置;

S23、设定第i个检测结果的输出模型为检测框集合;

S24、设立分类置信度阈值。

4.根据权利要求3所述的一种证件类图片的关键文本检测、分类训练方法,其特征在于,所述设定第i个检测结果的输出模型为检测框集合的计算方法如下:

其中,为第n个分类特征图中第x行、第y列的值,argmax输出分类结果为Clsi和分类得分,为得分,num_classes为类别数,position(X)为计算X各个位置坐标的函数,mean(X)为均值函数,Clsi为公共语言规范;Deti为第i个模型的检测框集合。

5.根据权利要求3所述的一种证件类图片的关键文本检测、分类训练方法,其特征在于,所述设立分类置信度阈值还包括以下步骤:

S241、当满足得分≥分类置信度阈值时,则保留检测结果;

S242、当满足得分<分类置信度阈值时,则丢弃检测结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浩鲸云计算科技股份有限公司,未经浩鲸云计算科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110853791.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top