[发明专利]文字识别方法、装置及设备在审

申请号：	202110788604.7	申请日：	2021-07-13
公开（公告）号：	CN113627262A	公开（公告）日：	2021-11-09
发明（设计）人：	薛鹏;赵振崇	申请（专利权）人：	深圳力维智联技术有限公司;南京中兴力维软件有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	深圳鼎合诚知识产权代理有限公司 44281	代理人：	郭燕;彭家恩
地址：	518000 广东省深圳市南山区粤海街道高新***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字识别方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种文字识别方法、装置及设备，通过获取待识别的单个文字的图片；将图片输入至预先训练好的目标识别模型中，得到待识别的单个文字与文字库中的各个文字的相似度，在对目标识别模型进行训练时，采用相似度损失和分类损失确定目标识别模型是否收敛，相似度损失根据第一字形相似度信息和第二字形相似度信息确定，第一字形相似度信息通过目标识别模型得到，第二字形相似度信息通过预设算法得到，分类损失通过预设分类损失函数得到；将待识别的单个文字确定为最大相似度所对应的文字。由于上述损失函数由通过分类损失和判定两个字之间相似度的相似度损失得到，而相似度损失可以使目标识别模型关注文字的整体结构，从而提高了文字识别的准确度。

技术领域

本发明涉及人工智能技术领域，具体涉及一种文字识别方法、装置及设备。

背景技术

文字识别，是利用计算机自动识别字符的技术，是人工智能的一个重要领域。人们在生产和生活中，要处理大量的文字。通过文字识别技术，可以减轻人们的劳动，提高处理效率。

目前的文字识别算法一般直接根据文字图片，经过卷积神经网络等模型进行分类，并且卷积神经网络等模型一般采用分类的损失函数。如果仅含有分类的损失函数，卷积神经网络等模型容易关注文字的局部信息，在训练样本较少的时候容易出现过拟合的问题，从而导致文字识别的准确度较低。

发明内容

本发明实施例提供一种文字识别方法、装置及设备，用以提高文字识别的准确度。

根据第一方面，一种实施例中提供一种文字识别方法，所述方法包括：

获取待识别的单个文字的图片；

将所述图片输入至预先训练好的目标识别模型中，得到所述待识别的单个文字与文字库中的各个文字的相似度；

将所述待识别的单个文字确定为最大相似度所对应的文字；

其中，训练所述目标识别模型，包括：