[发明专利]文字识别方法、装置、设备及存储介质在审
申请号: | 201811339691.2 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109685050A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 周罡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标特征 矩阵 文字识别 原始文字 卷积神经网络 存储介质 目标序列 文字特征 图像 计算机技术领域 预处理 目标文字 特征降维 特征提取 特征组合 文字图像 准确率 池化 降维 卷积 输出 | ||
本发明涉及计算机技术领域,提供了一种文字识别方法、装置、设备及存储介质,所述方法包括:对获取到的待识别的文字图像进行预处理,得到处理后的原始文字图像;根据卷积神经网络模型的卷积层定义,对每个原始文字图像进行文字的特征提取和特征组合,得到原始文字图像对应的N*N的文字特征矩阵;根据卷积神经网络模型的池化层定义,对每个文字特征矩阵进行特征降维处理,得到降维后的1*1的目标特征矩阵,并将1*1的目标特征矩阵中的目标特征值,作为一维目标序列点;将一维目标序列点组成的合集,作为一维目标特征序列;对一维目标特征序列进行识别,输出一维目标特征序列对应的目标文字数据。本发明能够提高文字识别效率和识别准确率。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字识别方法、装置、设备及存储介质。
背景技术
文字识别是计算机视觉中的一个重要领域,传统的文字识别技术是通过建立一定深度的人工神经网络来得到的文字识别模型,对包含了连续手写文字的图像进行识别,然后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的文字,直接对连续手写文字的图像识别过程,由于连续手写文字的图像中还包含了大量的冗余信息,容易受到冗余信息的干扰,造成识别到的图像中的文字特征的精度不高,导致对文字识别的识别准确度不高,且图像的维度大,使得识别复杂度高,增加了识别运算量,导致对文字识别的识别效率降低。
发明内容
基于此,有必要针对上述技术问题,提供一种文字识别方法、装置、设备及存储介质,以解决传统文字识别方法识别效率低和识别准确率不高的问题。
一种文字识别方法,包括:
获取待识别的文字图像;
根据预先训练好的卷积神经网络模型的输入层定义,对所述待识别的文字图像进行预处理,得到处理后的原始文字图像;
针对每个所述原始文字图像,根据所述卷积神经网络模型的卷积层定义,对所述原始文字图像进行文字的特征提取和特征组合,得到所述原始文字图像对应的N*N的文字特征矩阵,其中,N为正整数;
针对每个所述文字特征矩阵,根据所述卷积神经网络模型的池化层定义,对所述文字特征矩阵进行特征降维处理,得到降维后的1*1的目标特征矩阵,并将所述1*1的目标特征矩阵中的目标特征值,作为一维目标序列点;
将每个所述原始文字图像对应的所述一维目标序列点组成的合集,作为一维目标特征序列;
在预先训练好的循环神经网络模型中,对所述一维目标特征序列进行识别,输出所述一维目标特征序列对应的目标文字数据。
一种文字识别装置,包括:
图像获取模块,用于获取待识别的文字图像;
图像处理模块,用于根据预先训练好的卷积神经网络模型的输入层定义,对所述待识别的文字图像进行预处理,得到处理后的原始文字图像;
特征处理模块,用于针对每个所述原始文字图像,根据所述卷积神经网络模型的卷积层定义,对所述原始文字图像进行文字的特征提取和特征组合,得到所述原始文字图像对应的N*N的文字特征矩阵,其中,N为正整数;
特征降维模块,用于针对每个所述文字特征矩阵,根据所述卷积神经网络模型的池化层定义,对所述文字特征矩阵进行特征降维处理,得到降维后的1*1的目标特征矩阵,并将所述1*1的目标特征矩阵中的目标特征值,作为一维目标序列点;
序列生成模块,用于将每个所述原始文字图像对应的所述一维目标序列点组成的合集,作为一维目标特征序列;
文字识别模块,用于在预先训练好的循环神经网络模型中,对所述一维目标特征序列进行识别,输出所述一维目标特征序列对应的目标文字数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811339691.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置
- 下一篇:一种基于电网系统的红外图像故障诊断系统