[发明专利]通用字符识别方法、装置、计算机设备和存储介质在审
申请号: | 201910574434.5 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110414520A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 王健宗;闫旭;王威;韩茂琨 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符图像 计算机设备 存储介质 连接网络 三维矩阵 特征矩阵 通用字符 图像数字化处理 图像 人工智能 图像特征 文本检测 字符识别 复用 预设 申请 保证 | ||
本申请涉及一种基于人工智能的通用字符识别方法、装置、计算机设备和存储介质。所述方法包括:接收待识别图像,对待识别图像进行文本检测,得到待识别字符图像;将待识别字符图像进行图像数字化处理,得到待识别字符图像对应的三维矩阵;将三维矩阵输入至预设的密集连接网络,以利用密集连接网络对待识别字符图像进行图像特征的提取,得到待识别字符图像的特征矩阵;根据待识别字符图像的特征矩阵确定待识别字符图像中的字符。采用本方法能够保证特征复用,提高字符识别的精度。
技术领域
本申请涉及计算机技术领域,特别是涉及一种通用字符识别方法、装置、计算机设备和存储介质。
背景技术
通用字符是指常用可见的文本字符,包括文字、数字、字母以及特殊字符等。而随着神经网络的发展,现有通常使用层层依次连接的深度神经网络对通用字符进行识别。但是,对于通用字符识别来说,为了达到识别字符数数目多,识别精度高,可以应对复杂的文本场景等苛刻的要求,往往需要我们采用更深层的神经网络,以便进行更加复杂的特征模式的提取。然而,实验发现现有使用的深度神经网络出现了退化问题,即当增加深度神经网络的层数时,深度神经网络的准确度就会出现饱和,甚至出现下降,从而导致识别精度下降。
发明内容
基于此,有必要针对上述技术问题,提供一种实现高精度识别的通用字符识别方法、装置、计算机设备和存储介质。
一种通用字符识别方法,所述方法包括:
接收待识别图像,对所述待识别图像进行文本检测,得到待识别字符图像;
将所述待识别字符图像进行图像数字化处理,得到所述待识别字符图像对应的三维矩阵;
将所述三维矩阵输入预设的密集连接网络,以利用密集连接网络对所述待识别字符图像进行图像特征的提取,得到待识别字符图像的特征矩阵;
根据所述待识别字符图像的特征矩阵确定所述待识别字符图像中的字符。
在其中一个实施例中,所述利用密集连接网络对所述三维矩阵进行特征提取,得到待识别字符图像的特征矩阵的步骤,包括:
利用所述密集连接网络的二维卷积层对所述三维矩阵进行图像特征的提取,得到所述待识别字符图像的基础特征;
利用所述密集连接网络的密集卷积层从所述基础特征中提取所述待识别字符图像的深度特征;
将所述基础特征和所述深度特征相加,得到待识别字符图像的特征矩阵。
在其中一个实施例中,所述根据所述特征矩阵确定所述待识别字符图像中的字符的步骤,包括:
将所述特征矩阵进行池化,得到池化后的特征矩阵;
利用长短期记忆网络获取池化后的特征矩阵中各特征之间的关联信息;
根据所述关联信息确定所述待识别字符图像中的字符。
在其中一个实施例中,所述根据所述关联信息确定所述待识别字符图像中的字符的步骤,包括:
基于所述关联信息和预设的映射关系,从预设字典中映射得到识别结果;所述识别结果包括字符以及对应的识别概率;
根据所述识别概率选择字符,将选择的字符作为所述待识别字符图像中的字符。
在其中一个实施例中,所述接收待识别图像,对所述待识别图像进行预处理得到待识别字符图像的步骤,包括:
对所述待识别图像进行文本检测,得到字符候选区域以及对应的置信度;
当存在不小于预设置信度的置信度时,将对应所述置信度的字符候选区域进行缩放,得到缩放后的字符候选区域;
将所述缩放后的字符候选区域作为待识别字符图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910574434.5/2.html,转载请声明来源钻瓜专利网。