[发明专利]一种文本识别方法、装置、存储介质以及电子设备在审
申请号: | 202010558741.7 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111723586A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 李月;黄光伟;唐小军 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06K9/20 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 范继晨 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 存储 介质 以及 电子设备 | ||
本公开实施例提出了一种文本识别方法、装置、存储介质以及电子设备,所述方法包括:获取基于指定位置的文本图像;在所述文本图像中确定至少一个文本框,其中,每个所述文本框对应一个文本单元;在所述文本框中确定待译文本框;针对所述待译文本框进行预定操作,获取识别结果;其中,所述针对所述待译文本框进行预定操作,获取识别结果包括:在所述文本图像中基于所述待译文本框确定对应的图片单元;将所述图片单元旋转至水平姿态;对处于水平姿态的所述图片单元进行文本识别,确定最终识别结果。本公开实施例能够可以针对大倾斜角度的文本对其中的文本单元进行定位和识别,以提升用户在使用例如点读式翻译笔进行文本识别时的识别准确率。
技术领域
本公开涉及文本识别的技术领域,特别涉及一种文本识别方法、装置、存储介质以及电子设备。
背景技术
在现有技术中,可以通过图像采集装置或者具有图像采集功能的设备对文本进行图像采集,并针对图像采集后的图片进行文本的识别或者翻译等操作,例如点译式翻译笔,用户可以自然握笔的姿势使用,通过翻译笔上的摄像头进行纸面拍摄,然后通过设置在翻译笔上的处理器对离笔尖最近处的单词进行识别或者翻译。
但是,如图1所示,从翻译笔上的摄像头拍摄的图中可以看出,在用户倾斜握笔时单词的倾斜程度严重,基于现有的单词框定位技术识别难度大,这里的识别难主要原因是得到单词框的位置后,无法正确将倾斜的单词框对应的文字旋转至水平,最终导致识别错误。如图2所示,两个单词框的朝向基本一致的,但框内文字朝向差别很大,因为文本框位置无法反映出框内文字的朝向,因此,如何将文字正确旋转至水平状态是正确识别的关键。
发明内容
有鉴于此,本公开实施例提出了一种文本识别方法、装置、存储介质以及电子设备,以解决现有技术中无法针对大角度倾斜的文本进行准确识别的问题。
一方面,本公开实施例提出了一种文本识别方法,其包括以下步骤:获取基于指定位置的文本图像;在所述文本图像中确定至少一个文本框,其中,每个所述文本框对应一个文本单元;在所述文本框中确定待译文本框;针对所述待译文本框进行预定操作,获取识别结果;其中,所述针对所述待译文本框进行预定操作,获取识别结果包括:在所述文本图像中基于所述待译文本框确定对应的图片单元;将所述图片单元旋转至水平姿态;对处于水平姿态的所述图片单元进行文本识别,确定最终识别结果。
在一些实施例中,所述在所述文本框中确定待译文本框包括:基于所述指定位置,确定第一基准区域;分别计算所述第一基准区域与每个所述文本框之间的重叠面积;将所述重叠面积占所述第一基准区域的比例最大的所述文本框确定为待译文本框。
在一些实施例中,所述在所述文本框中确定待译文本框还包括:当不存在与所述第一基准区域重叠的文本框的情况下,对所述第一基准区域进行调整;确定与调整后的基准区域重叠的所述文本框;在所述文本框中确定所述待译文本框。
在一些实施例中,对所述第一基准区域进行调整的次数在预定阈值范围内。
在一些实施例中,所述针对所述待译文本框进行预定操作,获取识别结果包括:在所述文本图像中基于所述待译文本框确定对应的图片单元;将所述图片单元旋转至水平姿态;对处于水平姿态的所述图片单元进行文本识别,确定最终识别结果。
在一些实施例中,所述将所述图片单元旋转至水平姿态包括:确定所述图片单元中各顶点的编号;基于所述编号利用仿射变换法获取坐标变换矩阵;通过所述坐标变换矩阵对所述图片单元进行旋转,获取水平姿态的所述图片单元。
在一些实施例中,所述基于对处于水平姿态的所述图片单元进行文本识别,确定最终识别结果,包括:对水平姿态的所述图片单元进行文本识别,获取对应的初步识别结果;确定所述初步识别结果的置信度;根据所述置信度,确定所述最终识别结果。
在一些实施例中,所述确定所述初步识别结果的置信度包括:获取所述初步识别结果中每个文本元素的置信度以及所有所述文本元素的第一平均置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010558741.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种污水处理罐的堵头模具加工方法
- 下一篇:一种检测数据丢失的方法及系统