[发明专利]一种基于深度学习的文本识别方法、设备及存储介质在审
申请号: | 202111244912.X | 申请日: | 2021-10-25 |
公开(公告)号: | CN113971809A | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 武小亮;张铁监;汪洋;叶剑 | 申请(专利权)人: | 多伦科技股份有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/146;G06V30/166;G06V30/19;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 徐莹 |
地址: | 211112 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 文本 识别 方法 设备 存储 介质 | ||
本发明公开了一种基于深度学习的文本识别方法、设备及存储介质,包括:按照指定的格式进行数据集的制作;构建基于MobileNeXt网络的文本检测网络模型和损失函数;利用制作的数据集对网络模型和损失函数进行训练;获取某一场景的图片,利用图像处理开源库对获取的图片进行固定尺寸缩放、归一化处理;利用训练后的文本检测网络模型对处理后的图片进行推理预测,提取得到图片中的文本区域;对所提取的图片中的文本区域进行矫正,得到矫正后的文本区域;对矫正后的文本区域的图片进行预处理,再利用CRNN文本识别算法对预处理后的图片中的文本区域提取得到文字信息。本发明可使文本检测算法达到高精度、快速的同时进一步的减少文本粘连问题和对弯曲文本进行矫正。
技术领域
本发明涉及一种基于深度学习的文本识别方法、设备及存储介质,属于文本识别的技术领域。
背景技术
随着全球经济的迅速发展,工业界对多场景、多语种、高精度的文字检测与识别的关注越来越高,如场景理解,产品识别,自动驾驶、目标地理定位、文档电子化等方面的需要也是越来越迫切。近年来,随着AI技术不断发展,对文本检测和识别出现的难题更是越来越多,因此工业界和学术界对文本检测和识别探索也是越来越深入。
现有的方法大致可以分为四类:基于四边形边界框的检测器、基于字符的方法、基于分割的方法和基于参数结构化的方法。其中,大多数现有的基于四边形边界框的检测器难以定位任意形状的文本,难以很好地封闭在矩形中;大多数基于分割的方法可能不会分离彼此非常接近的文本实例;基于字符和基于参数结构化的方法需要代价高昂的标注信息。
在工业界应用中,基于分割的方法在场景文本检测中非常流行,因为分割结果可以更准确地描述各种形状的场景文本,例如曲线文本;同时能够在速度、精度、标注成本上达到很好的平衡。目前基于分割通用的算法是PseNet和DBNet,但是二者都有各自的缺点;PseNet的后处理耗时严重;DBnet的速度和精度达到很好的平衡,但是对临近的文本经常出现粘连的问题,同时还存在检测出的曲线文本严重降低了文本识别精度的问题。
针对上述比较棘手且迫切需要解决的问题,本发明提出了一种基于深度学习的文本识别方法。
发明内容
为了克服现有技术中存在的不足,本发明提供一种基于深度学习的文本识别方法、设备及存储介质,以解决现有的文字检测识别过程中文本粘连、推理速度慢、曲线文本矫正效果差的问题。本发明的方法能够在文档电子化、车辆轮胎号检测中得到广泛的应用。
本发明具体采用以下技术方案解决上述技术问题:
一种基于深度学习的文本识别方法,包括以下步骤:
步骤1、按照指定的格式进行数据集的制作;
步骤2、构建文本检测网络模型和损失函数;
步骤3、利用制作的数据集对所构建的文本检测网络模型和损失函数进行训练,得到训练后的文本检测网络模型;
步骤4、获取某一场景的图片;
步骤5、利用开源的图像处理操作库对获取的图片进行固定尺寸缩放、归一化处理;
步骤6、利用训练后的文本检测网络模型对步骤5处理后的图片进行推理预测,提取得到图片中的文本区域;
步骤7、利用贝塞尔曲线对步骤6所提取的图片中的文本区域进行矫正,得到矫正后的文本区域;
步骤8、对矫正后的文本区域的图片进行预处理,再利用CRNN文本识别算法对预处理后的图片中的文本区域提取得到文字信息。
进一步地,作为本发明的一种优选技术方案,所述步骤1按照指定的格式进行数据集的制作,具体包括:
步骤1-1、对某一场景的图片数据进行收集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于多伦科技股份有限公司,未经多伦科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111244912.X/2.html,转载请声明来源钻瓜专利网。