[发明专利]一种文本识别方法、装置、电子设备及存储介质在审

申请号：	202310039762.1	申请日：	2023-01-12
公开（公告）号：	CN116012847A	公开（公告）日：	2023-04-25
发明（设计）人：	尹天舒	申请（专利权）人：	北京奇艺世纪科技有限公司
主分类号：	G06V30/146	分类号：	G06V30/146;G06V30/14;G06V30/19
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	李冬;孟维娜
地址：	100080 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种文本识别方法、装置、电子设备及存储介质，涉及图像处理技术领域，方法包括：对待识别图像进行文本检测，确定待识别图像中文本的最小外接密闭图形对应的图像区域，作为第一图像；利用预设的图像校正算法对第一图像的方向进行校正，得到校正后的第一图像，作为当前的待处理图像；判断当前的待处理图像的宽高比是否大于预设阈值；若是，则将当前的待处理图像输入预先训练的横向文本识别模型中；若否，则将当前的待处理图像输入预先训练的竖向文本识别模型中，得到表示当前的待处理图像中每一字符为预设字符的概率的置信度；基于得到的置信度，确定待识别图像中文本包含的字符。如此，能够有效地识别出图像中的文本。

技术领域

本发明涉及图像处理技术领域，特别是涉及一种文本识别方法、装置、电子设备及存储介质。

背景技术

随着图像处理技术的发展，OCR(Optical Character Recognition，光学字符识别)模型能够对包含文本的图像进行识别，获取图像中文本的识别结果。

然而，在实际的场景中，图像中文本包含的字符的方向可能为横向，也可能是竖向。另外，该文本对应的文本框在图像中也可能并非为水平的，即，文本包含的各字符在图像中是倾斜的。

针对上述复杂的情况，亟需一种方法以有效地识别出图像中的文本。

发明内容

本发明实施例的目的在于提供一种文本识别方法、装置、电子设备及存储介质，以有效地识别出图像中的文本。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种文本识别方法，所述方法包括：

对待识别图像进行文本检测，确定所述待识别图像中文本的最小外接密闭图形对应的图像区域，作为第一图像；其中，所述待识别图像中文本包含的各字符的倾斜角度一致；

利用预设的图像校正算法对所述第一图像的方向进行校正，得到校正后的第一图像，作为当前的待处理图像；其中，当前的待处理图像中文本包含的各字符的排列方向为水平或竖直的；

判断当前的待处理图像的宽高比是否大于预设阈值；

若当前的待处理图像的宽高比大于预设阈值，则将当前的待处理图像输入预先训练的横向文本识别模型中，得到表示当前的待处理图像中每一字符为预设字符的概率的置信度；其中，所述横向文本识别模型用于对包含横向字符的文本进行识别；

若当前的待处理图像的宽高比不大于预设阈值，则将当前的待处理图像输入预先训练的竖向文本识别模型中，得到表示当前的待处理图像中每一字符为预设字符的概率的置信度；其中，所述竖向文本识别模型用于对包含竖向字符的文本进行识别；

基于得到的置信度，确定当前的待处理图像中文本包含的字符，作为所述待识别图像中文本包含的字符。

在一些实施例中，所述利用预设的图像校正算法对所述第一图像的方向进行校正，得到校正后的第一图像，作为当前的待处理图像，包括：

对所述第一图像进行旋转，以使旋转后的第一图像中文本包含的各字符的排列方向为水平或竖直的，得到第二图像；按照所述第二图像中文本的最小外接矩形的大小，对所述第二图像中文本所占的区域进行仿射变换，得到当前的待处理图像；

或，按照所述第一图像中文本的最小外接矩形的大小，对所述第一图像中文本所占的区域进行仿射变换，得到第三图像；对所述第三图像进行旋转，以使旋转后的第三图像中文本包含的各字符的排列方向为水平或竖直的，得到当前的待处理图像。

在一些实施例中，在所述对待识别图像进行文本检测，确定所述待识别图像中文本的最小外接密闭图形对应的图像区域，作为第一图像之前，所述方法还包括：

获取包含文本的原始图像；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司，未经北京奇艺世纪科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310039762.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种低成本织物阻燃整理胶及其制备方法
下一篇：一种PMMA微流控芯片封装方法及PMMA微流控芯片

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文本识别方法、装置、电子设备及存储介质在审

专利文献下载