[发明专利]基于Tesseract-OCR引擎的工件产品序列号识别方法、装置及系统在审
申请号: | 202210029288.X | 申请日: | 2022-01-11 |
公开(公告)号: | CN114399768A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 梅雪;何毅;翟天翔;李森伟 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/22;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211816 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 tesseract ocr 引擎 工件 产品 序列号 识别 方法 装置 系统 | ||
1.一种基于Tesseract-OCR引擎的工件产品序列号识别方法,其特征在于,包括:
采集场景内各类工件序列号图像,构建工件序列号数据集;
利用数据集中的工件序列号图像训练文本检测网络;
将待检测的工件序列号图像,输入到训练好的文本检测网络中进行文本检测,定位工件序列号图像中的文本部分;
提取数据集中工件序列号图像中的文本部分,通过jTessBoxEditor训练得出识别工件序列号图像中文本部分的Tesseract-OCR模型;
采用训练好的Tesseract-OCR模型,对待检测工件序列号图像中的文本部分进行识别,并筛选出序列号。
2.根据权利要求1所述的方法,其特征在于,所述文本检测网络为CTPN网络,训练所述CTPN网络包括:
使用VGG-16网络进行特征提取,在VGG-16网络的最后一个卷积层采用3×3的卷积核对特征图进行卷积;
将卷积后的特征输入双向长短时记忆模型进行学习;
通过全连接层输出预测参数到三个分类或者回归层中。
3.根据权利要求2所述的方法,其特征在于,在将卷积后的特征输入双向长短时记忆模型进行学习时,使用如下公式作为单元状态更新值的激活函数:
并使用自适应算法优化学习率,如下:
其中,l0是初始的学习率,需要设置较大,i表示第i次迭代的过程,L表示模型训练的总体迭代次数。
4.根据权利要求3所述方法,其特征在于,所述将待检测的工件序列号图像,输入到训练好的文本检测网络中进行文本检测,定位工件序列号图像中文本部分包括:
利用高斯模糊变换和二值化去噪方法获取待检测的工件序列号图像的灰度图像;
通过文本检测网络选取滑动窗口,同时给出判断该窗口内是否为文字的概率;
当概率大于设定阈值则判断为是文字,通过矩形框画出文字部分,并显示概率;
通过矩形框的特性利用OpenCV中的边缘轮廓与面积筛选模块去除过大和过小的文字区域,保留获得的文字区域。
5.根据权利要求4所述方法,其特征在于,所述提取数据集中工件序列号图像中的文本部分,通过jTessBoxEditor进行训练得出识别工件图像中文本部分的Tesseract-OCR模型包括:
制作数据集中工件序列号图像的文本部分的训练样本,利用jTessBoxEditor中的Merge TIFF选择文本部分的样本图片,并生成box文件以及字符配置文件,通过字符矫正工具对样本图片中的字符进行相应的位置以及识别矫正并且保存,训练生成语言文件。
6.根据权利要求1-5任一项所述方法,其特征在于,所述采用训练好的Tesseract-OCR模型,待检测工件序列号图像中的文本部分进行识别,并筛选出序列号包括:
在待检测图片中选取文字区域,将文字区域的部分先进行图片预处理;
输入训练好的Tesseract-OCR模型中进行识别,获取文字识别结果;
根据序列号的不同特性,筛选出符合条件的区域,若没有符合条件的区域,则表明图像中不包含序列号部分。
7.一种基于Tesseract-OCR引擎的工件产品序列号识别装置,其特征在于,包括:
数据集单元,其配置为采集场景内各类工件序列号图像,构建工件序列号数据集;
第一训练单元,其配置为利用数据集中的工件序列号图像训练文本检测网络;
文本定位单元,其配置为将待检测的工件序列号图像,输入到训练好的文本检测网络中进行文本检测,定位工件序列号图像中的文本部分;
第二训练单元,其配置为提取数据集中工件序列号图像中的文本部分,通过jTessBoxEditor训练得出识别工件序列号图像中文本部分的Tesseract-OCR模型;
识别单元,其配置为采用训练好的Tesseract-OCR模型,对待检测工件序列号图像中的文本部分进行识别,并筛选出序列号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210029288.X/1.html,转载请声明来源钻瓜专利网。