[发明专利]文字识别的方法、装置、电子设备及计算机可读存储介质有效

申请号：	202010616043.8	申请日：	2020-06-30
公开（公告）号：	CN111783760B	公开（公告）日：	2023-08-08
发明（设计）人：	张晓强;章成全;刘珊珊	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V30/14	分类号：	G06V30/14;G06V30/148;G06V30/18;G06V30/19;G06V10/82;G06N3/0464;G06N3/0455;G06N3/09
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	曹娜
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字识别方法装置电子设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了文字识别的方法、装置、电子设备及计算机可读存储介质，涉及人工智能、深度学习、计算机视觉技术领域。具体实现方案为：确定从图像中识别出的每个单字的语义信息和第一位置信息；根据每个单字的语义信息和第一位置信息，构建图网络；根据图网络计算的每个单字的特征，确定图像的文字识别结果。本申请实施例的图网络由于对每个单字的语义信息和第一位置信息进行解码计算，因此通过两个维度的信息可以更加准确的识别出图像中的文字。

技术领域

本申请涉及计算机技术领域，尤其涉及人工智能、深度学习、计算机视觉技术领域。

背景技术

自然场景下的端到端文字检测识别技术可以被广泛应用于社会的各行各业，如教育、医疗、金融等领域。由文字检测识别技术派生的常见卡证票据的识别、文档的自动化录入、拍照搜题等技术极大地提升了传统行业的智能化程度和生产效率，方便了人们的日常学习与生活。虽然自然场景下的端到端文字检测识别技术得到了快速发展，但其依然存在一定的问题，例如无法实现对图像中文字的准确识别，出现文字识别错误或未识别的情况。

发明内容

本申请提供了一种文字识别的方法、装置、电子设备及计算机可读存储介质。

根据本申请的一方面，提供了一种文字识别的方法，包括：

确定从图像中识别出的每个单字的语义信息和第一位置信息；

根据每个单字的语义信息和第一位置信息，构建图网络；

根据图网络计算的每个单字的特征，确定图像的文字识别结果。

根据本申请的另一方面，提供了一种文字识别的装置，包括：

第一确定模块，用于确定从图像中识别出的每个单字的语义信息和第一位置信息；

构建模块，用于根据每个单字的语义信息和第一位置信息，构建图网络；

第二确定模块，用于根据图网络计算的每个单字的特征，确定图像的文字识别结果。

根据本申请的另一方面，提供了一种电子设备，电子设备的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，电子设备的结构中包括处理器和存储器，存储器用于存储支持电子设备执行上述文字识别的方法的程序，处理器被配置为用于执行存储器中存储的程序。电子设备还可以包括通信接口，用于与其他设备或通信网络通信。