[发明专利]自动分割字符区域的图像文字检测模型训练方法及装置有效

专利信息
申请号: 202110021189.2 申请日: 2021-01-08
公开(公告)号: CN112733857B 公开(公告)日: 2021-10-15
发明(设计)人: 张乐平;张博;杨涛;侯磊;李海峰 申请(专利权)人: 北京匠数科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06N3/04;G06N3/08
代理公司: 北京盛凡佳华专利代理事务所(普通合伙) 11947 代理人: 王翠
地址: 100036 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自动 分割 字符 区域 图像 文字 检测 模型 训练 方法 装置
【说明书】:

自动分割字符区域的图像文字检测模型训练方法及装置,使用多层卷积神经网络抽取图像特征,然后通过卷积层将通道数转换为类别个数;生成的是目标图像按比例缩小的特征图,每个像素点的值是对应的类别,将特征图放大至目标图像尺寸即可作为文字区域的掩码图;将掩码与原图叠加即可得到包含文字的区域子图像;能够识别一行文字中的间隙并标记为背景,从而在掩码图中每个文字字符都已分隔开,只需简单的图像处理操作即可得到单个字符的图像。本发明得到的文字检测模型能够完成字符级别的文字检测,在检测过程中直接划分字符区域,简化图像文字识别的流程,提高计算性能;能够自动构建海量训练数据提供丰富的特征信息,以低成本训练高质量模型。

技术领域

本发明涉及图像识别技术领域,具体涉及一种自动分割字符区域的图像文字检测模型训练方法。

背景技术

文字区域检测通常使用图像检测模型(如Yolo,SSD等),图像检测模型能够输出文字区域坐标从而提取出对应的区域子图像。而区域子图像虽然包含了相邻范围内的所有文字,但并没有区分其中每一个字符的位置和轮廓,仍需要在字符识别模型中使用循环神经网络对整个文字区域进行滑动探测,以此识别出每一个字符。

文字区域检测模型的训练数据使用的是较大尺寸的带文本图像,人工标注其中的文字区域,训练数据使用人工标注成本高,模型推理阶段不能切分字符,导致后续需要用更加复杂的文字识别模型(基于循环神经网络)来分析识别字符,模型尺寸较大,推理时间长,难以应用在实时图像流分析场景和嵌入式系统上。综上亟需一种新的图像文字检测模型训练技术方案。

发明内容

为此,本发明实施例提供一种自动分割字符区域的图像文字检测模型训练方法及装置,使得到的图像文字检测模型能够完成字符级别的文字检测,实现低成本训练高质量的图像文字检测模型。

为了实现上述目的,本发明的实施方式提供如下技术方案:一种自动分割字符区域的图像文字检测模型训练方法,包括以下步骤:

采用卷积神经网络抽取目标图像特征,利用卷积层将所述目标图像的通道数转换为类别个数;

通过文字区域检测模型生成所述目标图像按比例缩小的特征图,将所述特征图中每个像素点的值对应于所述类别;

将所述特征图放大至所述目标图像的尺寸并作为文字区域的掩码图,将生成的掩码与目标图像叠加获得包含文字的区域子图像;

对所述区域子图像进行文字间隙识别,将所述文字间隙标记为背景,使所述掩码图中每个文字字符分隔开。

作为自动分割字符区域的图像文字检测模型训练方法的优选方案,所述文字区域检测模型在训练时按照图像分类模型进行训练,将卷积层输出后添加Flatten层转换,再添加一个softmax层输出类别。

作为自动分割字符区域的图像文字检测模型训练方法的优选方案,所述文字区域检测模型在推理时,去掉最后的Flatten层和softmax层,直接获取卷积层的输出。

作为自动分割字符区域的图像文字检测模型训练方法的优选方案,对所述目标图像采用原始尺寸或按比例缩放后进行输入,采用文字区域检测模型对整张目标图像进行扫描和特征提取,每次卷积依次提取目标图像的一块区域,对文字区域检测模型前向计算得到每个区域的对应特征。

作为自动分割字符区域的图像文字检测模型训练方法的优选方案,当区域中出现预设范围字符时将该区域标记为文字区域;

在对输入的目标图像扫描的过程中,当计算窗口经过一组字符时,将字符的周围均输出为0,字符中心输出为1,在最终的特征图上把每个字符区域分割开来。

作为自动分割字符区域的图像文字检测模型训练方法的优选方案,进行文字图像生成工具构建,通过所述文字图像生成工具随机设定字体、灰度和大小,从已有的语料库中随机选取文字组合打印成为文字位图;将所述文字位图合并至随机选取的背景图像上,根据窗口采样规则提取选定区域作为训练数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京匠数科技有限公司,未经北京匠数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110021189.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top