[发明专利]一种基于深度学习的圆柱体上OCR的读取方法及其设备在审
申请号: | 202110948821.8 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113392848A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 施晨涛;任世强;吴潘 | 申请(专利权)人: | 海特锐(天津)科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/20;G06N3/04;G06N3/08 |
代理公司: | 北京沁优知识产权代理有限公司 11684 | 代理人: | 郭娜 |
地址: | 300000 天津市津南区津南*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 圆柱体 ocr 读取 方法 及其 设备 | ||
1.一种基于深度学习的圆柱体上OCR的读取方法,其特征在于,包括如下步骤:
步骤一,至少选取两台相机进行拍照采集,根据OCR的大小选择合适的相机安装角度,使相邻两相机的重合视野区域面积不小于每个相机视野区域面积的1/3;
步骤二,设置相机参数并拍照采集;
步骤三,用YOLOv3搭建目标检测基础模型,用ResNet34模型搭建后端分类模型,得到深度学习模型;
步骤四,对相机采集到的图片数据样本进行标注,生成对应的样本标注文件;
步骤五,使用样本标注文件对深度学习模型进行训练,得到OCR模型;
步骤六,通过相机进行拍照采集图片数据;
步骤七,步骤六中的相机采集到的图片数据输入到步骤五中的OCR模型进行图片数据识别和字符标注处理,得到字符数据;
步骤八,步骤七得到的字符数据进行处理以及整合,实现OCR读取。
2.根据权利要求1所述的基于深度学习的圆柱体上OCR的读取方法,其特征在于:步骤五中,所述深度学习模型包括cbr卷积模块、crc卷积模块及Deep卷积模块,所述cbr卷积模块由卷积层conv、批量标准化层bn及Relu激活函数相互串接形成,所述crc卷积模块由卷积层conv、Relu激活函数及卷积层conv串接形成,所述Deep卷积模块由两个cbr卷积模块串接形成,所述cbr卷积模块、所述crc卷积模块及所述Deep卷积模块用于对所述OCR图片进行特征抽取,形成所述OCR检测模型。
3.根据权利要求1所述的基于深度学习的圆柱体上OCR的读取方法,其特征在于:步骤八中,还包括有去掉重复字符数据、对字符数据进行纵向排列和对字符集合进行分割以及整合三部分。
4.根据权利要求3所述的基于深度学习的圆柱体上OCR的读取方法,其特征在于:
步骤八中,去掉重复字符数据: 从单张图片中检测出OCR的特征位置以及最大位置范围,深度学习模型会将每个位置的字符数据映射到多个类,每个类对应一个字符与类的相似度分数值,分数值的取值范围都是0到1,通过取同一位置的最高分数值去掉重复的字符数据。
5.根据权利要求3所述的基于深度学习的圆柱体上OCR的读取方法,其特征在于:
步骤八中,对字符数据进行纵向排列:通过对输出点的y方向的坐标yi值进行升序排列,对于总个数是M,行数为N的字符处理方式是
其所在行数
其中nk是字符所在的行数,M是字符总个数,N是字符行数,i是字符的索引,取值范围是0到M-1,y1是所有字符中y坐标的最小值,y2是所有字符中y坐标的最大值,yj是所有字符中y坐标最小值与最大值的平均值。
6.根据权利要求3所述的基于深度学习的圆柱体上OCR的读取方法,其特征在于:
步骤八中,对字符集合进行分割以及整合:对于任意相机Cam_L与Cam_R的单行字符的处理方式是在整个视野中取个有效总字符满足总字符数 ,其中LL是左侧相机中的字符数,LR是右侧相机中的字符数,且左侧相机从图像左侧开始取字符,右侧相机从图像右侧开始取字符,对每一行字符进行如上操作,得到拍摄弧面的全部字符。
7.一种圆柱体上OCR的读取设备,其特征在于:包括:
至少两台相机;
光源;
处理器,所述处理器与所述相机、所述光源相连,其中,所述处理器包括图片融合及识别软件;以及
控制器,用于实现权利要求1-5任意一项所述的一种基于深度学习的圆柱体上OCR的读取方法;
所述控制器分别与所述相机、所述光源和所述处理器相连,当所述光源照射到圆柱面上的OCR时,控制器控制所述相机在预设时间采集图像,获取多个OCR的部分平面图像,以及控制所述处理器运行所述图像融合及识别软件,融合所述多个OCR的部分平面图像,生成所述OCR的完整平面图像,并对所述完整平面图像进行处理和识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海特锐(天津)科技有限公司,未经海特锐(天津)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110948821.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多目标预测方法、装置、设备及存储介质
- 下一篇:一种光学玻璃切打磨一体化装置