[发明专利]一种基于深度学习的无分割字符定位与识别方法有效
申请号: | 201710215116.0 | 申请日: | 2017-04-02 |
公开(公告)号: | CN107133616B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 俞芳芳;董蓉;朱泽民;李勃;查俊;梁振华;史德飞;陈和国;黄璜;周子卿;史春阳 | 申请(专利权)人: | 南京汇川图像视觉技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06K9/62 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 奚铭 |
地址: | 211100 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度学习的无分割字符定位与识别方法,首先构建深度卷积神经网络,包括通用卷积层网络、候选区域定位网络、分类识别网络三大部分;其次构建整个网络整体的目标函数,以实现整个网络全局端对端的训练;继而采用人工标定的训练集以及“递进‑联合”的训练方式对网络进行训练;当应用至测试时,利用训练所得的网络可提取测试图像中若干字符的可能区域及分类识别的结果;最后,对网络所得结果进行非极大值抑制及得分阈值判断的后处理,得到最终的检测结果。本发明方法使用简单,无需进行字符分割预处理,可兼容多种字符形态,且具有较强的抗背景干扰能力,可作为一种通用的字符检测方法。 | ||
搜索关键词: | 一种 基于 深度 学习 分割 字符 定位 识别 方法 | ||
【主权项】:
一种基于深度学习的无分割字符定位与识别方法,其特征是包括如下步骤:步骤S1:构建深度卷积神经网络,所述多层卷积神经网络包括通用卷积层网络、候选区域定位网络和分类识别网络,设定多层卷积神经网络的输入为图像,输出为图像上各字符的类别和在图像上的位置坐标;步骤S2:定义候选区域定位网络的损失函数,及分类识别网络的分类损失函数,构建整个网络整体的目标函数,以实现整个网络的训练;步骤S3:采用标定好的字符类别及位置信息的训练集对网络进行训练,训练方式采用“递进‑联合”的训练方式,从而得到用于进行字符定位和识别的网络模型:3.1)训练通用卷积层部分,采用从PASCAL VOC 2012的ZF模型进行迁移初始化;3.2)在已训练好的通用卷积层的基础上增加候选区域定位网络进行训练,固定通用卷积层网络参数,采用随机初始化的方式初始化候选区域定位网络参数,根据步骤S2中定义的候选区域定位网络的损失函数对候选区域定位网络参数进行调整;3.3)增加分类识别网络,固定通用卷积层网络以及候选区域定位网络参数,采用随机初始化的方式初始化分类识别网络的参数,根据步骤S2中定义的分类识别网络损失函数,对分类识别网络的参数进行学习和调整;3.4)根据步骤S2中定义的整个网络整体的目标函数对整个网络进行端对端的微调,获得最终的训练结果;步骤S4:输入测试图像,利用步骤S3中得到的网络提取图像中若干字符的可能区域及分类识别的结果;步骤S5:对步骤S4中所得到的候选字符识别结果进行非极大值抑制得分阈值判断,得到最终的检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京汇川图像视觉技术有限公司,未经南京汇川图像视觉技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710215116.0/,转载请声明来源钻瓜专利网。