[发明专利]文本识别方法、装置、电子设备以及存储介质在审

申请号：	201911134547.X	申请日：	2019-11-19
公开（公告）号：	CN111126140A	公开（公告）日：	2020-05-08
发明（设计）人：	王洪振;黄珊	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/20;G06K9/32;G06K9/34;G06K9/62;G06N3/04
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	蔡艾莹
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置电子设备以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种文本识别方法、装置、电子设备以及存储介质，其中，该文本识别方法包括：获取待识别图像，所述待识别图像包括待检测文本，对所述待识别图像进行语义分割，得到所述待检测文本对应的多个目标像素点以及每个目标像素点对应的像素关联信息，基于像素关联信息以及多个目标像素点，确定每个目标像素点在所述待识别图像中的位置以及所述待检测文本的偏转信息，根据所述偏转信息对所述待检测文本的角度进行调整，对调整后的待检测文本进行文本识别，得到文本识别结果，该方案可以有效地提高文本检测的准确率，进而提高文本识别的准确率。

技术领域

本发明涉及计算机技术领域，具体涉及一种文本识别方法、装置、电子设备以及存储介质。

背景技术

自然场景图像是由各种拍摄设备(如照相机或手机等)在没有特定限制的条件下，直接对生活中真实存在的场景拍摄的图像。自然场景图像中的文本可提供丰富的语义信息，为了识别自然场景图像中的文本，可以通过OCR(Optical Character Recognition，光学字符识别)技术对自然场景图像中的文本进行识别。

其中，OCR技术包含两个级联的步骤：文本检测和文本识别，文本检测是定位文本出现的位置，文本识别是利用识别算法获取文字信息，然而，不同的拍摄角度会导致降低文本检测的准确率，进而降低了文本识别的准确率。

发明内容

本发明实施例提供一种文本识别方法、装置、电子设备以及存储介质，可以提高文本检测的准确率，进而提高了文本识别的准确率。

本发明实施例提供了一种文本识别方法，包括：

获取待识别图像，所述待识别图像包括待检测文本；

对所述待识别图像进行语义分割，得到所述待检测文本对应的多个目标像素点以及每个目标像素点对应的像素关联信息；

基于像素关联信息以及多个目标像素点，确定每个目标像素点在所述待识别图像中的位置以及所述待检测文本的偏转信息；

根据所述偏转信息对所述待检测文本的角度进行调整；

对调整后的待检测文本进行文本识别，得到文本识别结果。

相应的，本发明实施例还提供了一种文本识别装置，包括：

获取模块，用于获取待识别图像，所述待识别图像包括待检测文本；

分割模块，用于对所述待识别图像进行语义分割，得到所述待检测文本对应的多个目标像素点以及每个目标像素点对应的像素关联信息；