[发明专利]一种文本识别方法、装置、电子设备及存储介质在审

申请号：	202310041175.6	申请日：	2023-01-12
公开（公告）号：	CN116012832A	公开（公告）日：	2023-04-25
发明（设计）人：	尹天舒	申请（专利权）人：	北京奇艺世纪科技有限公司
主分类号：	G06V20/62	分类号：	G06V20/62;G06V30/18;G06V30/19;G06V10/82;G06N3/047;G06N3/0464
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	李冬;孟维娜
地址：	100080 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种文本识别方法、装置、电子设备及存储介质，涉及图像处理技术领域，方法包括：获取包含文本的待识别图像；将当前的待识别图像，输入至预先训练的文本识别模型中的特征提取网络，得到当前的特征图像；将当前的特征图像输入至文本识别模型中的全连接层，得到当前的特征图像中每一列对应的多个置信度；针对当前的特征图像中每一列，确定该列对应的各置信度在归一化后的最大值，作为该列的预测概率；若各列的预测概率的加权和大于预设阈值，则基于各列对应的最大的置信度各自表征的预设字符，确定当前的待识别图像中文本包含的字符。如此，能够有效地识别出图像中的文本，提高识别出的文本的准确度。

技术领域

本发明涉及图像处理技术领域，特别是涉及一种文本识别方法、装置、电子设备及存储介质。

背景技术

随着图像处理技术的快速发展，在越来越多的场景中，需要识别图像中包含的文本。

例如，在监控场景中，需要确定包含车辆的图像中该车辆的车牌号；在安防场景中，需要确定包含用户证件的图像中该用户的身份信息。

因此，亟需一种方法以有效地识别出图像中包含的文本。

发明内容

本发明实施例的目的在于提供一种文本识别方法、装置、电子设备及存储介质，以有效地识别出图像中的文本，且提高识别出的文本的准确度。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种文本识别方法，所述方法包括：

获取包含文本的待识别图像；

将当前的待识别图像，输入至预先训练的文本识别模型中的特征提取网络，得到当前的特征图像；

将当前的特征图像输入至所述文本识别模型中的全连接层，得到当前的特征图像中每一列对应的多个置信度；其中，当前的特征图像中一列对应的多个置信度分别表示：该列为各预设字符的概率；