[发明专利]一种字符识别方法、装置、设备及存储介质在审
申请号: | 202111671276.9 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114332871A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 蒋磊;朱辉辉;张建树 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06K9/62;G06V10/74;G06V10/774;G06V30/19 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 鲁梅 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 识别 方法 装置 设备 存储 介质 | ||
本申请提出一种字符识别方法、装置、设备及存储介质,该方法包括:获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果;通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果;其中,所述字符元素序列由字符的各个构成元素,以及各个构成元素之间的位置关系信息组成;基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果。采用上述方案能够取得更好的字符识别效果。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种字符识别方法、装置、设备及存储介质。
背景技术
光学字符识别,是指对图像中的文字进行识别的技术。常规的光学字符识别方案主要包括两种:第一种是基于CTC解码的识别方案。该方案首先通过卷积神经网络和循环神经网络提取图像特征,然后通过CTC解码方法自动对齐字符,实现端到端的文本识别。第二种是基于序列到序列(seq2seq)的识别方案。该方案由encoder和decoder两部分组成,通过一个encoder提取文本行图像的特征,然后通过一个decoder将图像特征解码为字符序列,其中每个解码时刻所用的上下文特征向量通过一个注意力模块计算得到。
上述的光学字符识别方案是通用的光学字符识别方法,其中均应用了神经网络。神经网络是数据驱动的模型,当训练不充分或者不全面的情况下,通常无法准确地识别光学字符,从而导致通过上述的光学字符识别方案,无法取得理想的字符识别效果,具体表现为无法准确识别所有字符。
发明内容
基于上述技术现状,本申请提出一种字符识别方法、装置、设备及存储介质,用于解决上述技术问题,提高字符识别效果。
为了解决上述问题,本申请提出如下技术方案:
一种字符识别方法,包括:
获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果;
通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果;其中,所述字符元素序列由字符的各个构成元素,以及各个构成元素之间的位置关系信息组成;
基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果。
可选的,通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果,包括:
将所述解码特征输入预先训练的结构解码模型,使所述结构解码模型通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的字符识别结果,并将所述结构解码模型所确定的字符识别结果作为与所述文本图像对应的第二字符识别结果。
可选的,获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果,包括:
将文本图像输入预先训练的字符识别模型,使所述字符识别模型对所述文本图像进行特征提取及字符识别处理,得到所述字符识别模型输出的解码特征以及字符识别结果,并将所述字符识别模型输出的字符识别结果作为与所述文本图像对应的第一字符识别结果。
可选的,所述第一字符识别结果与所述第二字符识别结果中,分别记录所述文本图像中的待识别字符被识别为预设字典中的各个字符的概率;
基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果,包括:
将所述第一识别结果与所述第二识别结果进行融合处理,确定对所述文本图像的字符识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111671276.9/2.html,转载请声明来源钻瓜专利网。