[发明专利]通用字符识别方法、装置、计算机设备和存储介质在审
申请号: | 201910574434.5 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110414520A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 王健宗;闫旭;王威;韩茂琨 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符图像 计算机设备 存储介质 连接网络 三维矩阵 特征矩阵 通用字符 图像数字化处理 图像 人工智能 图像特征 文本检测 字符识别 复用 预设 申请 保证 | ||
1.一种通用字符识别方法,所述方法包括:
接收待识别图像,对所述待识别图像进行文本检测,得到待识别字符图像;
将所述待识别字符图像进行图像数字化处理,得到所述待识别字符图像对应的三维矩阵;
将所述三维矩阵输入预设的密集连接网络,以利用密集连接网络对所述待识别字符图像进行图像特征的提取,得到待识别字符图像的特征矩阵;
根据所述待识别字符图像的特征矩阵确定所述待识别字符图像中的字符。
2.根据权利要求1所述的方法,其特征在于,所述将所述三维矩阵输入预设的密集连接网络,以利用密集连接网络对所述待识别字符图像进行图像特征的提取,得到待识别字符图像的特征矩阵的步骤,包括:
利用所述密集连接网络的二维卷积层对所述三维矩阵进行图像特征的提取,得到所述待识别字符图像的基础特征;
利用所述密集连接网络的密集卷积层从所述基础特征中提取所述待识别字符图像的深度特征;
将所述基础特征和所述深度特征相加,得到待识别字符图像的特征矩阵。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待识别字符图像的特征矩阵确定所述待识别字符图像中的字符的步骤,包括:
将所述特征矩阵进行池化,得到池化后的特征矩阵;
利用长短期记忆网络获取池化后的特征矩阵中各特征之间的关联信息;
根据所述关联信息确定所述待识别字符图像中的字符。
4.根据权利要求3所述的方法,其特征在于,所述根据所述关联信息确定所述待识别字符图像中的字符的步骤,包括:
基于所述关联信息和预设的映射关系,从预设字典中映射得到识别结果;所述识别结果包括字符以及对应的识别概率;
根据所述识别概率选择字符,将选择的字符作为所述待识别字符图像中的字符。
5.根据权利要求1所述的方法,其特征在于,所述接收待识别图像,对所述待识别图像进行文本检测,得到待识别字符图像的步骤,包括:
对所述待识别图像进行文本检测,得到字符候选区域以及对应的置信度;
当存在不小于预设置信度的置信度时,将对应所述置信度的字符候选区域进行缩放,得到缩放后的字符候选区域,将所述缩放后的字符候选区域作为待识别字符图像。
6.根据权利要求5所述的方法,其特征在于,所述将对应所述置信度的字符候选区域进行缩放,得到缩放后的字符候选区域,将所述缩放后的字符候选区域作为待识别字符图像的步骤,包括:
根据预设高度值,调整所述置信度对应的字符候选区域的高度,得到高度调整后的字符候选区域;
对所述高度调整后的字符候选区域的宽度进行补零,直到满足预设最大宽度值为止;
将所述满足预设最大宽度值的字符候选区域作为待识别字符图像。
7.根据权利要求1所述的方法,其特征在于,所述将所述待识别字符图像进行图像数字化处理,得到所述待识别字符图像对应的三维矩阵的步骤,包括:
获取所述待识别字符图像中所有像素对应的RGB值;
将各所述像素对应的RGB值转换为三维矩阵。
8.一种通用字符识别装置,其特征在于,所述装置包括:
接收模块,用于接收待识别图像,对所述待识别图像进行文本检测,得到待识别字符图像;
转换模块,用于将所述待识别字符图像进行图像数字化处理,得到所述待识别字符图像对应的三维矩阵;
提取模块,用于将所述三维矩阵输入预设的密集连接网络,以利用密集连接网络对所述待识别字符图像进行图像特征的提取,得到待识别字符图像的特征矩阵;
确定模块,用于根据所述待识别字符图像的特征矩阵确定所述待识别字符图像中的字符。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910574434.5/1.html,转载请声明来源钻瓜专利网。