[发明专利]文字识别方法、装置及电子设备有效
申请号: | 202010767955.5 | 申请日: | 2020-08-03 |
公开(公告)号: | CN111914825B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 康健;黄珊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/18;G06V30/19;G06F40/126;G06N3/0464;G06V10/82;G06N3/08 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 韩绍君 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 装置 电子设备 | ||
1.一种文字识别方法,其特征在于,所述方法包括:
获取待识别图像,所述待识别图像包括待识别文字,所述待识别文字包括至少一个字符组,所述字符组包括至少一个字符;
从所述待识别图像中提取图像特征,并根据所述图像特征确定与所述待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括所述候选文字中各字符组的编码信息,所述第一概率表示所述待识别文字是所述候选文字的概率;
根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,所述第二编码序列包括所述候选文字中各字符的编码信息,所述第二概率表示所述候选文字是正确文字的概率;
根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,并将所述目标编码序列所表示的候选文字确定为所述待识别文字的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,包括:
从各所述候选文字的第一编码序列中确定使所述第一概率和所述第二概率的乘积取得最大值的候选文字的第一编码序列,并将该候选文字的第一编码序列确定为所述待识别文字对应的目标编码序列。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
获取字符编码约束模型基于所述第二编码序列输出的正确性分数;
对所述正确性分数进行归一化,并将归一化后的正确性分数确定为所述第二概率。
4.根据权利要求3所述的方法,其特征在于,所述待识别文字是元音标注文字,所述字符编码约束模型通过以下方式训练得到:
获取正样本数据和负样本数据,所述正样本数据包括正确的元音标注文字中各字符的编码信息,所述负样本数据包括错误的元音标注文字中各字符的编码信息;
获取字符编码约束模型基于所述正样本数据输出的第一得分,以及基于所述负样本数据输出的第二得分;
基于所述第一得分和所述第二得分调整所述字符编码约束模型的模型参数,使调整后的字符约束编码模型输出的第一得分和第二得分的差距增大。
5.根据权利要求1或2所述的方法,其特征在于,所述第二编码序列为所述候选文字中各字符的编码信息按照所述候选文字的书写顺序排列而成的序列,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
针对所述第二编码序列中第i个字符的编码信息,获取在所述第i个字符之前的N个字符的编码信息出现的情况下,所述第i个字符的编码信息出现的条件概率,其中,N为大于1的正整数,1≤i≤N,i为正整数;
将所述候选文字中各字符的编码信息的条件概率的乘积,确定为所述第二概率。
6.根据权利要求1或2所述的方法,其特征在于,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
获取所述第二编码序列在位于所述待识别文字之前的各已识别文字的第二编码序列存在的情况下出现的条件概率,并将该条件概率确定为所述第二概率。
7.根据权利要求1或2所述的方法,其特征在于,所述第一概率通过如下步骤获得:
获取字形模型根据所述图像特征输出的第三概率,所述第三概率与所述待识别文字的一个候选文字对应,并用于表示所述待识别文字的字形是该候选文字的字形的概率;
获取语言模型根据位于所述待识别文字之前的至少一个已识别文字输出的第四概率,所述第四概率表示在所述至少一个已识别文字存在的情况下,所述待识别文字出现的条件概率;
将所述第三概率与所述第四概率的乘积确定为所述第一概率。
8.根据权利要求1或2所述的方法,其特征在于,所述待识别文字中的至少一个字符组沿第一方向排列,所述字符组中的至少一个字符沿第二方向排列,所述第一方向为文字书写方向,所述第一方向与所述第二方向相互垂直。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010767955.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:上麦方法、装置、服务器及终端
- 下一篇:一种便于拆卸的内置式机柜空调内机