[发明专利]一种文本检测的方法、装置、电子设备和存储介质有效

专利信息
申请号: 202010513951.4 申请日: 2020-06-08
公开(公告)号: CN111666933B 公开(公告)日: 2023-04-07
发明(设计)人: 尹磊;邓小兵;张春雨 申请(专利权)人: 广东小天才科技有限公司
主分类号: G06V30/14 分类号: G06V30/14;G06V30/148;G06V30/19;G06V10/82
代理公司: 广州智斧知识产权代理事务所(普通合伙) 44649 代理人: 孔德超
地址: 528850 广东省东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 检测 方法 装置 电子设备 存储 介质
【说明书】:

发明实施例公开了一种文本检测的方法、装置、电子设备和存储介质。该方法包括:获取目标图片的文本行区域掩码的掩码图;确定掩码图中各个像素点的值,在编号为i的文本行区域掩码中,其文本行区域掩码内的各个像素点的值为i;将掩码图中第j行像素点的值减去第j+1行对应像素点的值,得到第j行或第j+1行像素点的新值;新值中等于‑i和i的像素点的集合,分别形成编号为i的文本行区域掩码对应的第一边界信息和第二边界信息;利用第一边界信息和第二边界信息构造编号为i的文本行区域掩码对应的文本行轮廓。实施本发明实施例,可以快速确定各个文本行的轮廓,降低整个文本识别的耗时。

技术领域

本发明涉及文本检测技术领域,具体涉及一种文本检测的方法、装置、电子设备和存储介质。

背景技术

在文本识别技术中,拍照图像受环境影响很大,在文字识别中,需要对文本行进行检测,获取最佳的文本行外接框,从而对外接框内的文本进行识别。

现有经典的文本检测技术是主要是基于PSENet的文本行检测算法,其将FPN和PSE技术相结合,先通过FPN检测出各个文本行,然后在基于PSE的后处理,即渐进式尺度扩展算法后,输出的是一个针对文本区域和背景多分类的mask图,即输出一个尺寸与输入图像相同的只有一个通道的矩阵,每个的值为0、1、2......n(n为输入图像中完整的文本行区域数量),表明输入图像中为背景或者是文本区域,该矩阵可以对应一个掩码图,掩码图的尺寸与输入图像的尺寸相同,掩码图中的各个值对应一个文本行区域掩码,例如值为1的点的集合构成第一个文本行区域掩码,值为0的点的集合为输入图像的背景区域。

得到了多分类的mask图像后,还需要通过Opencv中的findContours函数,针对每个文本行区域掩码进行遍历,以找出每个文本行区域的轮廓范围。但是这里需要针对每个文本行区域掩码进行找轮廓的操作,而且针对文本行区域较为密集的输入图像,找轮廓的整体耗时较高,达到了400ms以上,占整体文本行检测算法的80%-90%左右,因此影响了OCR整体的耗时。

发明内容

针对所述缺陷,本发明实施例公开了一种文本检测的方法、装置、电子设备和存储介质,其可以快速确定各个文本行的轮廓,降低整个文本识别的耗时。

本发明实施例第一方面公开一种文本检测的方法,所述方法包括:

获取目标图片的文本行区域掩码的掩码图,所述掩码图与目标图片的尺寸相同;

确定所述掩码图中各个像素点的值,在编号为i的文本行区域掩码中,其文本行区域掩码内的各个像素点的值为i,掩码图中文本行区域掩码外的其余像素点的值为0;1≤i≤M,M为目标图片对应的文本行区域掩码的总数;

将掩码图中第j行像素点的值减去第j+1行对应像素点的值,得到第j行或第j+1行像素点的新值,其中,1≤j≤N,N为掩码图的总行数;

所述新值中等于-i的像素点的集合,形成编号为i的文本行区域掩码对应的第一边界信息,所述新值中等于i的像素点的集合,形成编号为i的文本行区域掩码对应的第二边界信息;

利用所述第一边界信息和第二边界信息构造编号为i的文本行区域掩码对应的文本行轮廓。

作为一种可选的实施方式,在本发明实施例第一方面中,获取目标图片的文本行区域掩码的掩码图,包括:

获取目标图片;

将所述目标图片输入预先训练过的基于深度学习的文本行检测网络模型,输出带有各个文本行区域掩码的掩码图。

作为一种可选的实施方式,在本发明实施例第一方面中,所述利用所述第一边界信息和第二边界信息构成构造编号为i的文本行区域掩码对应的文本行轮廓,包括:

根据所述第一边界信息和第二边界信息确定编号为i的文本行区域掩码对应的中线位置和高度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010513951.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top