[发明专利]基于Tesseract-OCR引擎的工件产品序列号识别方法、装置及系统在审
申请号: | 202210029288.X | 申请日: | 2022-01-11 |
公开(公告)号: | CN114399768A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 梅雪;何毅;翟天翔;李森伟 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/22;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211816 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 tesseract ocr 引擎 工件 产品 序列号 识别 方法 装置 系统 | ||
本发明公开了一种基于Tesseract‑OCR引擎的工件产品序列号识别方法、装置及系统,属于图像处理、计算机视觉与模式识别领域。包括采集场景内各类工件序列号图像,构建工件序列号数据集;利用数据集中的工件序列号图像训练文本检测网络;将待检测的工件序列号图像,输入到训练好的文本检测网络中进行文本检测,定位工件序列号图像中的文本部分;提取数据集中工件序列号图像中的文本部分,通过jTessBoxEditor训练得出识别工件图像中文本部分的Tesseract‑OCR模型;采用训练好的Tesseract‑OCR模型,对待检测工件序列号图像中的文本部分进行识别,并筛选出序列号。所述系统包括客户端和服务器端。本发明能够有效地检测定位与识别序列号,符合智能制造对自动检测并识别工件图片序列号的需求。
技术领域
本发明属于图像处理、计算机视觉与模式识别领域,具体涉及一种基于Tesseract-OCR引擎的工件产品序列号识别方法、装置及系统。
背景技术
中国制造业的快速发展,智慧工厂的概念被提出和逐步实现,工厂的智慧化和信息化的需求也逐渐提升。工件序列号作为验证工件产品合法身份的保障,可以依此确定具体工件的参数和性能指标,进行相应的检测、识别和存储是一项重要工作,较人工采集、记录,自动识别的方法,工件序列号的智能化识别系统,有利于提高准确度,和生产效率。目前,除人工记录的方法外,一些工厂采用二维码的方式记录工件的序列号,虽然部分地提升了效率,但是降低了工件序列号的直观性。
场景文本识别是指在复杂的自然场景下,对图像所展示的文字进行检测和识别的过程,目前场景文本识别的方法主要有传统文本检测与识别方法和基于深度学习的文本检测识别方法。传统文本检测与识别方法基于人工设计的特征和规则,模型体量小,但是泛化能力较差,无法应对复杂的工厂环境,而基于深度学习的场景文本检测与识别方法相较于传统文本识别方法,其性能和效率都大大提升。
例如在文本检测方面,传统方法通过滑动窗口或者区域连通的方法,对图像进行形态学操作、条件随机场等一些基于图的方法进行抑制和融合,从而获得文字所在区域,而深度学习方法则可以通过例如目标检测或者实例分割技术,检测出实例文本,例如通过Faster R-CNN、Mask R-CNN或者DBNet技术对图片中的文本进行定位与检测。而在文本识别方面,传统方法通常是以单字符作为输入对切割出文字进行识别,一般采用提取人工设计特征(如HOG特征等)提取特征,再通过机器学习分类器(如SVM等)进行识别。而深度学习的方法则是可以利用深度网络,例如CRNN网络对输入的文字区域整体进行识别。
随着场景文本检测定位和光学字符识别准确率的提升,如何提高文本检测与识别模型的泛化能力,将其应用于复杂的、有较多干扰的实际工厂是一个具有现实意义的问题。例如申请号为CN201810846616.9的中国专利申请公开了一种序列号识别方法、系统、移动终端及存储介质,通过获取足够照明条件下的待检测图片,对图片进行预处理如滤波二值化,最后进行字符分割识别,但这种方法依赖于图片的光照环境,并且对于前期图片预处理的要求过高,难以实际的生产需要。因此,构建一套智能化的工件序列号识别系统是十分有必要的,是实现智慧工厂以及智能制造的关键一环,是制造业向智慧化、信息化迈进的重要组成部分
发明内容
技术问题:针对目前工厂内工件产品序列号的检测、识别与储存需求的问题,提出了一种基于Tesseract-OCR引擎的工件产品序列号识别方法与系统,从而能够有效地对工件序列号进行识别与归类。
技术方案:本发明第一方面,提供一种基于Tesseract-OCR引擎的工件产品序列号识别方法,包括:
采集场景内各类工件序列号图像,构建工件序列号数据集;
利用数据集中的工件序列号图像训练文本检测网络;
将待检测的工件序列号图像,输入到训练好的文本检测网络中进行文本检测,定位工件序列号图像中的文本部分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210029288.X/2.html,转载请声明来源钻瓜专利网。