[发明专利]一种字符识别方法及装置有效
申请号: | 201611082212.4 | 申请日: | 2016-11-30 |
公开(公告)号: | CN108121984B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 郑钢 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 识别 方法 装置 | ||
本发明实施例提供了一种字符识别方法及装置,所述方法包括:获取待分析的包括字符的目标图像;将所述目标图像输入预先训练的深度神经网络中,确定所述目标图像的字符区域对应的特征图;通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别,得到所述目标图像中包括的字符;其中,所述深度神经网络是根据各样本图像、各样本图像的字符区域标定结果、以及各样本图像中包括的字符训练得到的。本发明实施例能够提高字符识别的准确性。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种字符识别方法及装置。
背景技术
随着图像处理技术的发展,从图像中能够获取到越来越多的信息。如,通过对监控图像进行识别,能够获取到图像中包括的车辆的车牌号,建筑物标识等;或者,通过对快递单进行识别,能够得到快递单号等。
现有的字符识别方法,主要为根据人工设计的特征,从图像中检测包含字符的字符区域;然后对字符区域进行分割,得到各字符块;最后对各字符块进行分类器识别,从而得到图像中包含的字符。
但是,上述方法中,检测图像中的字符区域,以及对字符区域进行分割时,是根据人工设计的特征进行检测的。实际应用中,由于不同的场景,不同的拍摄条件等,会导致图像质量差别较大。而人工设计的特征,不能很好地适应各种质量的图像,从而导致字符区域检测和字符区域分割结果准确性较低,进一步导致字符识别结果精确性较低。
发明内容
本发明实施例的目的在于提供一种字符识别方法及装置,以提高字符识别的准确性。具体技术方案如下:
第一方面,本发明实施例提供了一种字符识别方法,所述方法包括:
获取待分析的包括字符的目标图像;
将所述目标图像输入预先训练的深度神经网络中,确定所述目标图像的字符区域对应的特征图;
通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别,得到所述目标图像中包括的字符;
其中,所述深度神经网络是根据各样本图像、各样本图像的字符区域标定结果、以及各样本图像中包括的字符训练得到的。
可选地,所述确定所述目标图像的字符区域对应的特征图的步骤包括:
根据预设的划分规则,确定所述目标图像中包括的各候选区域;
对所述各候选区域进行特征提取,得到各候选区域对应的特征图;
根据各候选区域对应的特征图,识别包含字符的特征图,并将所识别出的特征图确定为所述目标图像的字符区域对应的特征图。
可选地,所述确定所述目标图像中包括的各候选区域之后,所述方法还包括:
对各候选区域的位置和/或形状进行调整。
可选地,所述确定所述目标图像的字符区域对应的特征图的步骤包括:
对所述目标图像进行特征提取,得到所述目标图像对应的特征图;
对所述目标图像对应的特征图进行像素级分析,识别包含字符的区域,并将所识别出的区域对应的特征图确定为所述目标图像中的字符区域对应的特征图。
可选地,所述深度神经网络至少包括:卷积神经网络、循环神经网络、分类器、以及序列解码器;所述通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别,得到所述目标图像中包括的字符的步骤包括:
通过所述卷积神经网络对所述各字符区域进行字符级特征提取;
通过所述循环神经网络对所述各字符区域进行上下文特征提取;
通过所述分类器和序列解码器对所提取的特征图进行分类识别,得到所述目标图像中包括的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611082212.4/2.html,转载请声明来源钻瓜专利网。