[发明专利]文字图像校正处理方法、装置、设备及存储介质在审
申请号: | 201811416986.5 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109583445A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 周罡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06K9/34 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 角度检测 文字图像 校正处理 检测图像 目标文字 校正 卷积神经网络 存储介质 基础结构 样本图像 预设 计算机技术领域 待检测图像 框架构建 目标图像 学习 | ||
1.一种文字图像校正处理方法,其特征在于,所述文字图像校正处理方法包括:
获取包含文字和文字倾斜角度的样本图像;
基于深度学习框架构建预设的卷积神经网络基础结构,并使用所述样本图像对所述卷积神经网络基础结构进行训练,得到用于检测图像中的文字倾斜角度的角度检测模型;
获取包含目标文字的待检测图像;
在所述角度检测模型中,对所述待检测图像中的目标文字进行倾斜角度的角度检测,得到所述目标文字的角度检测结果;
根据所述角度检测结果,按照预设的校正方式,对所述待检测图像进行校正处理,得到校正后的目标图像。
2.如权利要求1所述的文字图像校正处理方法,其特征在于,所述角度检测模型包括输入层、卷积网络层、全连接网络层和包含四种预设角度类别定义的分类层,所述在所述角度检测模型中,对所述待检测图像中的目标文字进行倾斜角度的角度检测,得到所述目标文字的角度检测结果包括:
根据所述角度检测模型中所述输入层的定义,对所述待检测图像进行预处理,得到预处理后的原始图像;
根据所述角度检测模型中所述卷积网络层的定义,对所述原始图像中的所述目标文字的倾斜角度进行角度特征提取,得到包含角度特征值的所述目标文字的角度特征矩阵;
根据所述角度检测模型中所述全连接网络层的定义,按照预设的维度映射条件,对所述角度特征矩阵进行维度映射,得到所述角度特征矩阵对应的四维特征向量,其中,所述四维特征向量中的每个分量的位置对应一种预设角度类别;
根据所述角度检测模型中所述分类层的定义,计算所述四维特征向量的每个所述分量的得分;
选取数值最大的所述得分对应的所述预设角度类别的角度值,作为所述目标文字的检测结果。
3.如权利要求2所述的文字图像校正处理方法,其特征在于,所述根据所述角度检测模型中所述输入层的定义,对所述待检测图像进行预处理,得到预处理后的原始图像包括:
按照预设的图像缩放方式,对所述待检测图像进行图像缩放,得到基础图像;
将所述基础图像,按照预设的裁剪方式进行图像裁剪,得到标准图像;
对所述标准图像进行去均值和归一化处理,并将处理后的标准图像作为所述待检测图像的原始图像。
4.如权利要求2所述的文字图像校正处理方法,其特征在于,所述根据所述角度检测模型中所述分类层的定义,计算所述四维特征向量的每个所述分量的得分包括:
获取所述四维特征向量的每个所述分量;
采用如下计算公式,计算所述四维特征向量中每个所述分量的得分p:
其中,xi为所述四维特征向量中的所述分量,i为所述四维特征向量中的第i个分量。
5.如权利要求1所述的文字图像校正处理方法,其特征在于,所述根据所述角度检测结果,按照预设的校正方式,对所述待检测图像进行校正处理,得到校正后的目标图像包括:
以所述待检测图像的中心点为轴,按照所述角度检测结果中的所述角度值对所述待检测图像进行预设方向的角度旋转,得到旋转后的基础校正图像;
将所述基础校正图像与预设的空白背景模板进行合成,并将合成后的图像作为所述目标图像,其中,所述空白背景模板的大小与所述待检测图像的大小相同。
6.一种文字图像校正处理装置,其特征在于,所述文字图像校正处理装置包括:
样本获取模块,用于获取包含文字和文字倾斜角度的样本图像;
模型训练模块,用于基于深度学习框架构建预设的卷积神经网络基础结构,并使用所述样本图像对所述卷积神经网络基础结构进行训练,得到用于检测图像中的文字倾斜角度的角度检测模型;
目标获取模块,用于获取包含目标文字的待检测图像;
目标检测模块,用于在所述角度检测模型中,对所述待检测图像中的目标文字进行倾斜角度的角度检测,得到所述目标文字的角度检测结果;
图像校正模块,用于根据所述角度检测结果,按照预设的校正方式,对所述待检测图像进行校正处理,得到校正后的目标图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811416986.5/1.html,转载请声明来源钻瓜专利网。