[发明专利]一种基于深度学习的OCR方法有效
申请号: | 201811257203.3 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109376658B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 王慜骊;林路;桂晓雷;安通鉴;林康;陈立强 | 申请(专利权)人: | 信雅达科技股份有限公司;安徽省信雅达软件工程有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/19;G06V30/26;G06V30/148;G06V30/168;G06V30/18;G06K9/62;G06N3/04 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 张解翠 |
地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 ocr 方法 | ||
1.一种基于深度学习的OCR方法,其特征在于,该方法包括如下步骤:S1:获取待识别图像;
S2:对待识别图像进行缩放,然后对缩放后的图像进行预处理,所述的预处理为锐化、灰度化、二值化、矫正倾斜、降噪、去公章中的任意一项或多项;
去公章采用如下方法:S2.1:将待识别图像由RGB颜色空间模型转化到HSI颜色空间模型,采用阈值控制法提取红色分量,并把彩色图像灰度化,然后采用图像细化算法对图像进行细化得到骨架图;
S2.2:采用椭圆、圆形和矩形三种形状检测算法对S2.1得到的骨架图进行形状检测,从而定位获取包围公章的最小的矩形轮廓和公章在待识别的图像中的位置,并将印章提取出来;
S2.3:将包围公章的最小的矩形轮廓从待识别的图像中分离,然后将剩余的彩色图像灰度化,并使用图像修复算法,获得无印章的图像,具体为:
(1)将包围公章的最小的矩形轮廓从待识别的图像中分离,然后将剩余的彩色图像灰度化和全局二值化;
(2)使用图像膨胀处理覆盖掉印章的边缘轮廓;
(3)选用FMM图像的修复算法,进一步修复印章的边缘轮廓的残留痕迹,获得无印章的图像;
S3:将预处理后的图像放入深度学习神经网络中,得到缩放处理后图像的多个候选文本区域;
S4:将缩放处理后图像的多个候选文本区域放入基于深度学习神经网络中,将候选文字区域中的内容转换为计算机可读的文本;
S5:将上述计算机可读的文本放入深度学习语言模型中,对文本识别结果进行校正。
2.根据权利要求1所述的方法,其特征在于,所述的S3具体为:
S3.1:生成文本区域候选框,以缩放处理后的图像作为inception-RPN网络的输入,在VGG16模型的卷积特征响应图上滑动一个inception网络,并在每个滑动位置辅助一套文本特征先验框,计算每一个候选文本区域的得分;其中,所述的RPN网络是在CNN上增加全卷积层的分类层和边框回归层的全卷积网络,Inception Module中包含3种1x1,3x3,5x5的不同尺寸的卷积和一个最大3x3池化层,所述的Inception-RPN网络,是模仿Inception结构构造RPN网络,并只用了单层结构的Inception来提取候选文本区域;
S3.2:并入文本类别监督信息,融入多层次的区域下采样信息;
S3.3:将每一行的文本特征输入到LSTM网络模型中,对文本的高度、文本的起始位置和结束位置进行判断,以一种端到端的方式训练候选文本区域生成网络;
S3.4:对所述的候选文本区域位置进行修正,获得具有一定方向的倾斜文本候选文本区域;
S3.5:使用候选框过滤算法对候选文本区域进行过滤,移除远超出实际文本区域的多余的候选区域。
3.根据权利要求1所述的方法,其特征在于,所述的S4具体为:
S4.1:使用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取,把每个候选文本区域表示成特征向量;
S4.2:采用双层循环神经网络对所述的特征向量进行处理,并输出一个关于字符集的概率分布;
S4.3:采用CTC网络作为转录层,将关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法,输出计算机可读文本;其中,所述的CTC网络有一个softmax输出层,除了序列的输出外,还增加一个额外的输出单元,最开始激励的|L|个单元被解释成在这个时刻对应标签的观察概率,激励的额外的单元是一个空白的观察概率或者无标签的观察概率,这些输出定义为在给定输入序列的情况下,所有可能的对齐所有标记序列的方式;标记序列的概率是所有可能对齐方式的概率和。
4.根据权利要求1所述的方法,其特征在于,所述S5具体为:
S5.1:建立语料库,并用语料库训练词向量和语言模型;
S5.2:将S4得到的计算机可读文本放入训练后的语言模型中,并将集束搜索方式嵌入所述的语言模型中,输出修正后的文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信雅达科技股份有限公司;安徽省信雅达软件工程有限公司,未经信雅达科技股份有限公司;安徽省信雅达软件工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811257203.3/1.html,转载请声明来源钻瓜专利网。