[发明专利]字符识别方法、字符译码模型的训练方法及电子设备有效
申请号: | 202010591459.9 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111738248B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 蔡啸;晋兆龙;肖潇 | 申请(专利权)人: | 苏州科达科技股份有限公司 |
主分类号: | G06V30/10 | 分类号: | G06V30/10;G06V30/18;G06V30/19;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 张琳琳 |
地址: | 215011 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 译码 模型 训练 电子设备 | ||
1.一种字符识别方法,其特征在于,包括:
获取目标字符图像以及预设字典;其中,所述预设字典中包括多个预设词组;
将所述目标字符图像输入字符译码模型中,以使得所述字符译码模型利用所述预设字典输出字符序列;
基于所述多个预设词组,依次对所述字符序列中预设长度的连续字符进行词组验证,以得到目标字符序列;
所述字符译码模型的输出还包括所述字符序列中各个字符对应于所述预设字典中各个字符的概率;其中,所述基于所述多个预设词组,依次对所述字符序列中预设长度的连续字符进行词组验证,以得到目标字符序列,包括:
提取所述多个预设词组中以所述预设长度的连续字符中的第一字符开始且长度为所述预设长度的词组;
利用所述字符序列中各个字符对应于所述预设字典中各个字符的概率,计算所述字符序列中所述预设长度的连续字符的第一联合后验概率值以及各个所述预设长度的词组的第二联合后验概率值;
基于所述第一联合后验概率值以及所有所述第二联合后验概率值,确定所述预设长度的连续字符对应的目标词组。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一联合后验概率值以及所有所述第二联合后验概率值,确定所述预设长度的连续字符对应的目标词组,包括:
获取预设加权值;
计算所述预设加权值与各个所述第二联合后验概率值的乘积,得到各个加权处理后的第二联合后验概率值;
依次对比所述第一联合后验概率值与所述各个加权处理后的第二联合后验概率值,确定所述目标词组。
3.根据权利要求1所述的方法,其特征在于,所述将所述目标字符图像输入字符译码模型中,以使得所述字符译码模型利用所述预设字典输出字符序列,包括:
将所述目标字符图像输入所述字符译码模型中的特征提取模块中进行特征提取,输出第一特征序列;
将所述第一特征序列输入所述字符译码模型中的循环神经网络模块中进行关联处理,输出第二特征序列;
对所述第二特征序列进行译码得到所述字符序列。
4.根据权利要求3所述的方法,其特征在于,所述循环神经网络模块为双层残差双向长短期记忆模块;每层残差双向长短期记忆模块分为并行的3个支路,所述每层残差双向长短期记忆模块的输出序列为所述3个支路对应输出序列的叠加;其中,第一支路依次包括第一反向层、第一长短期记忆单元以及第二反向层,第二支路为所述残差双向长短期记忆模块输入端与输出端的连接,第三支路包括第二长短期记忆单元。
5.根据权利要求1所述的方法,其特征在于,所述获取目标字符图像,包括:
获取目标图像;
将所述目标图像输入字符检测模块中,输出所述目标图像中字符文本行的位置信息;
基于所述字符文本行的位置信息从所述目标图像中提取所述字符文本行对应的图像,以得到所述目标字符图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科达科技股份有限公司,未经苏州科达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010591459.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢结构支架
- 下一篇:激光通信终端收发同轴实时校准方法