[发明专利]一种字符识别方法、装置、设备及存储介质在审
申请号: | 202111671276.9 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114332871A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 蒋磊;朱辉辉;张建树 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06K9/62;G06V10/74;G06V10/774;G06V30/19 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 鲁梅 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 识别 方法 装置 设备 存储 介质 | ||
1.一种字符识别方法,其特征在于,包括:
获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果;
通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果;其中,所述字符元素序列由字符的各个构成元素,以及各个构成元素之间的位置关系信息组成;
基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果。
2.根据权利要求1所述的方法,其特征在于,通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果,包括:
将所述解码特征输入预先训练的结构解码模型,使所述结构解码模型通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的字符识别结果,并将所述结构解码模型所确定的字符识别结果作为与所述文本图像对应的第二字符识别结果。
3.根据权利要求1所述的方法,其特征在于,获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果,包括:
将文本图像输入预先训练的字符识别模型,使所述字符识别模型对所述文本图像进行特征提取及字符识别处理,得到所述字符识别模型输出的解码特征以及字符识别结果,并将所述字符识别模型输出的字符识别结果作为与所述文本图像对应的第一字符识别结果。
4.根据权利要求1所述的方法,其特征在于,所述第一字符识别结果与所述第二字符识别结果中,分别记录所述文本图像中的待识别字符被识别为预设字典中的各个字符的概率;
基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果,包括:
将所述第一识别结果与所述第二识别结果进行融合处理,确定对所述文本图像的字符识别结果。
5.根据权利要求4所述的方法,其特征在于,将所述第一识别结果与所述第二识别结果进行融合处理,确定对所述文本图像的字符识别结果,包括:
以所述第一字符识别结果的权重为第一权重、所述第二字符识别结果的权重为第二权重,对所述第一字符识别结果和所述第二字符识别结果进行加权求和,确定所述文本图像中的待识别字符被识别为预设字典中的各个字符的加权求和后的概率;
根据所述文本图像中的待识别字符被识别为预设字典中的各个字符的加权求和后的概率,确定对所述文本图像的字符识别结果。
6.根据权利要求5所述的方法,其特征在于,所述第一权重和所述第二权重的大小按照如下方式确定:
如果所述第一字符识别结果中所记录的识别概率最大的字符,是预先设置的形近字列表中的字符,则设置所述第二权重大于所述第一权重;其中,所述形近字列表中存储字形相近的字符对;所述识别概率最大的字符,是待识别字符被识别为预设字典中的各个字符的概率中的最大概率对应的字符;
如果所述第一字符识别结果中所记录的识别概率最大的字符,不是预先设置的形近字列表中的字符,则设置所述第二权重不大于所述第一权重。
7.根据权利要求1所述的方法,其特征在于,所述第一字符识别结果与所述第二字符识别结果,分别为对所述文本图像中的待识别字符进行识别得到的字符;
基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果,包括:
从所述第一字符识别结果和所述第二字符识别结果中,选出对所述文本图像的字符识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111671276.9/1.html,转载请声明来源钻瓜专利网。