[发明专利]文字识别方法、装置、设备及存储介质在审
申请号: | 201811339691.2 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109685050A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 周罡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标特征 矩阵 文字识别 原始文字 卷积神经网络 存储介质 目标序列 文字特征 图像 计算机技术领域 预处理 目标文字 特征降维 特征提取 特征组合 文字图像 准确率 池化 降维 卷积 输出 | ||
1.一种文字识别方法,其特征在于,所述文字识别方法包括:
获取待识别的文字图像;
根据预先训练好的卷积神经网络模型的输入层定义,对所述待识别的文字图像进行预处理,得到处理后的原始文字图像;
针对每个所述原始文字图像,根据所述卷积神经网络模型的卷积层定义,对所述原始文字图像进行文字的特征提取和特征组合,得到所述原始文字图像对应的N*N的文字特征矩阵,其中,N为正整数;
针对每个所述文字特征矩阵,根据所述卷积神经网络模型的池化层定义,对所述文字特征矩阵进行特征降维处理,得到降维后的1*1的目标特征矩阵,并将所述1*1的目标特征矩阵中的目标特征值,作为一维目标序列点;
将每个所述原始文字图像对应的所述一维目标序列点组成的合集,作为一维目标特征序列;
在预先训练好的循环神经网络模型中,对所述一维目标特征序列进行识别,输出所述一维目标特征序列对应的目标文字数据。
2.如权利要求1所述的文字识别方法,其特征在于,所述根据预先训练好的卷积神经网络模型的输入层定义,对所述待识别的文字图像进行预处理,得到处理后的原始文字图像包括:
按照预设的图像缩放方式,对所述待识别的文字图像进行图像缩放处理,得到基础文字图像;
按照预设的图像裁剪方式对所述基础文字图像进行图像裁剪,得到M个标准文字图像,其中,M为正整数;
对每个所述标准文字图像进行去均值处理和归一化处理,得到处理后的所述原始文字图像。
3.如权利要求1所述的文字识别方法,其特征在于,所述针对每个所述原始文字图像,根据所述卷积神经网络模型的卷积层定义,对所述原始文字图像进行文字的特征提取和特征组合,得到所述原始文字图像对应的N*N的文字特征矩阵包括:
针对每个所述原始文字图像,根据所述卷积神经网络模型的卷积层定义,对所述原始文字图像进行文字特征提取,得到文字特征值;
按照预设的特征组合方式将所述文字特征值组合成所述原始文字图像对应的N*N的文字特征矩阵,其中,每个N*N的文字特征矩阵包括N*N个文字特征值,N为正整数。
4.如权利要求3所述的文字识别方法,其特征在于,所述针对每个所述文字特征矩阵,根据所述卷积神经网络模型的池化层定义,对所述文字特征矩阵进行特征降维处理,得到降维后的1*1的目标特征矩阵,并将所述1*1的目标特征矩阵中的目标特征值,作为一维目标序列点包括:
针对每个所述文字特征矩阵,按照预设的矩阵切割方式,对所述文字特征矩阵进行切割,得到切割后的特征子矩阵;
从每个所述特征子矩阵中,选取数值最大的所述文字特征值,作为最大特征值;
将每个所述最大特征值组成k*k的基础特征矩阵,其中,k为正整数,且k小于等于N;
将所述基础特征矩阵作为新的所述文字特征矩阵,并重复执行按照所述矩阵切割方式进行的切割处理,以及最大特征值的提取处理,直到得到1*1的基础特征矩阵;
将所述1*1的基础特征矩阵作为所述1*1的目标特征矩阵,并将所述1*1的目标特征矩阵中的所述目标特征值,作为一维目标序列点。
5.如权利要求1所述的文字识别方法,其特征在于,所述在预先训练好的循环神经网络模型中,对所述一维目标特征序列进行识别,输出所述一维目标特征序列对应的目标文字数据包括:
根据预先训练好的循环神经网络模型的结构定义,对所述一维目标特征序列进行解析,得到所述一维目标特征序列对应的基础文字数据;
按照预设的过滤方式,对所述基础文字数据进行过滤,并将过滤后的所述基础文字数据作为所述文字特征向量对应的所述目标文字数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811339691.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置
- 下一篇:一种基于电网系统的红外图像故障诊断系统