[发明专利]一种文本检测的方法、装置、电子设备和存储介质有效
申请号: | 202010513951.4 | 申请日: | 2020-06-08 |
公开(公告)号: | CN111666933B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 尹磊;邓小兵;张春雨 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148;G06V30/19;G06V10/82 |
代理公司: | 广州智斧知识产权代理事务所(普通合伙) 44649 | 代理人: | 孔德超 |
地址: | 528850 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 装置 电子设备 存储 介质 | ||
1.一种文本检测的方法,其特征在于,包括:
获取目标图片的文本行区域掩码的掩码图,所述掩码图与目标图片的尺寸相同;
确定所述掩码图中各个像素点的值,在编号为i的文本行区域掩码中,其文本行区域掩码内的各个像素点的值为i,掩码图中文本行区域掩码外的其余像素点的值为0;1≤i≤M,M为目标图片对应的文本行区域掩码的总数;
将掩码图中第j行像素点的值减去第j+1行对应像素点的值,得到第j行或第j+1行像素点的新值,其中,1≤j≤N,N为掩码图的总行数;
所述新值中等于-i的像素点的集合,形成编号为i的文本行区域掩码对应的第一边界信息,所述新值中等于i的像素点的集合,形成编号为i的文本行区域掩码对应的第二边界信息;
利用所述第一边界信息和第二边界信息构造编号为i的文本行区域掩码对应的文本行轮廓。
2.根据权利要求1所述的方法,其特征在于,获取目标图片的文本行区域掩码的掩码图,包括:
获取目标图片;
将所述目标图片输入预先训练过的基于深度学习的文本行检测网络模型,输出带有各个文本行区域掩码的掩码图。
3.根据权利要求1所述的方法,其特征在于,所述利用所述第一边界信息和第二边界信息构成构造编号为i的文本行区域掩码对应的文本行轮廓,包括:
根据所述第一边界信息和第二边界信息确定编号为i的文本行区域掩码对应的中线位置和高度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一边界信息和第二边界信息确定编号为i的文本行区域掩码对应的中线位置和高度,包括:
确定所述新值中等于-i的像素点的第一坐标对应的新值中等于i的像素点的第二坐标,所述第一坐标和第二坐标的横坐标相同;
将所述第一坐标和第二坐标的纵坐标相加后求平均,得到中点位置;所有中点位置的集合构成编号为i的文本行区域掩码对应的中线位置;
将所述第一坐标和第二坐标的纵坐标相减后取绝对值,得到高度信息;所有高度信息的集合构成编号为i的文本行区域掩码对应的高度;
基于所述编号为i的文本行区域掩码对应的中线位置和高度构造编号为i的文本行区域掩码对应的文本行轮廓。
5.根据权利要求1所述的方法,其特征在于,所述利用所述第一边界信息和第二边界信息构成构造编号为i的文本行区域掩码对应的文本行轮廓,包括:
将所述新值中等于-i的像素点依次相连,形成编号为i的文本行区域掩码对应的第一边界;将所述新值中等于i的像素点依次相连,形成编号为i的文本行区域掩码对应的第二边界;
确定所述新值等于-i的像素点中横坐标最小的像素点为第一像素点,确定所述新值等于i的像素点中横坐标最小的像素点为第二像素点;确定所述新值等于-i的像素点中横坐标最大的像素点为第三像素点,确定所述新值等于i的像素点中横坐标最大的像素点为第四像素点;
将第一像素点和第二像素点连接,作为编号为i的文本行区域掩码对应的左边界;将第三像素点和第四像素点,连接作为编号为i的文本行区域掩码的右边界;
将所述左边界、第一边界、右边界以及第二边界构成的闭合框形成所述编号为i的文本行区域掩码对应的文本行轮廓。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法,还包括:
确定编号为i的文本行区域掩码对应的文本行轮廓在所述目标图片中的位置,将所述文本行轮廓合成于所述目标图片中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010513951.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种循环工作设备
- 下一篇:一种分段式组合电线杆