[发明专利]一种文字识别的方法及装置有效

申请号：	201910546270.5	申请日：	2019-06-21
公开（公告）号：	CN110287951B	公开（公告）日：	2022-04-12
发明（设计）人：	许海伦;李轩;刘家铭;刘珊珊;刘涛;韩钧宇	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V30/14	分类号：	G06V30/14;G06V10/82;G06N3/04;G06N3/08
代理公司：	北京市铸成律师事务所 11313	代理人：	章凯;李够生
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文字识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提出一种文字识别的方法及装置。所述方法包括：获得待识别的目标图像，以及与所述目标图像上的文字对应的语种信息；将所述目标图像和所述语种信息输入融合语种信息的文字识别模型，获得识别结果。本发明实施例能够通过融合语种信息的文字识别模型，对多个语种的文字图片进行文字识别，适用范围广，简化模型部署。

技术领域

本发明涉及计算机技术领域，尤其涉及一种文字识别的方法及装置。

背景技术

目前，利用计算机对图片中的文字进行识别，是模式识别应用的一个重要领域。人们在生产和生活中，要处理大量的文字、报表和文本。计算机识别文字，减轻了人们的劳动，提高了处理效率。

文字识别一般包括文字信息的采集、信息的分析与处理等几个部分。现有技术的文字识别，面临多语种文字识别的问题，不能够有效地实现多语种文字识别。

发明内容

本发明实施例提供一种文字识别的方法及装置，以解决现有技术中的一个或多个技术问题。

第一方面，本发明实施例提供了一种文字识别方法，包括：

获得待识别的目标图像，以及与所述目标图像上的文字对应的语种信息；

将所述目标图像和所述语种信息输入融合语种信息的文字识别模型，获得识别结果。

在一种实施方式中，所述融合语种信息的文字识别模型包括图像编码器、语种编码器和解码器，所述将所述目标图像和所述语种信息输入融合语种信息的文字识别模型，获得识别结果，包括：

将所述目标图像输入所述图像编码器进行图像特征编码，得到图像特征；