[发明专利]文本检测方法、装置、设备及存储介质在审
申请号: | 202110005121.5 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112329761A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06K9/38 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;邓海鸿 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 设备 存储 介质 | ||
本申请提出一种文本检测方法、装置、设备及存储介质;其中,该方法包括:获取待识别文本图像的初始特征图像;将初始特征图像经由包含多个通道的预设模型进行特征提取,得到针对多个通道的目标特征图像,目标特征图像中所述多个通道的第一通道提取的特征信息表征文本区域概率图,多个通道中除第一通道以外的所有其他通道提取的总特征信息表征文本区域所对应的像素点的总编码值,相同文本区域对应的像素点的总编码值相同,不同文本区域之间的像素点的总编码值不同;基于文本区域概率图所表征的各像素点的概率值,以及基于所有其他通道所提取的总编码值,确定出待识别文本图像中各像素点所对应的特征值,以确定出待识别文本图像的多个文本区域。
技术领域
本申请涉及图像处理技术,尤其涉及一种文本检测方法、装置、设备及存储介质。
背景技术
文本检测应用范围广泛,是很多计算机视觉任务的前置步骤,其主要目的是定位文本行或字符在图像中的位置,文本的精准定位既十分重要又具备挑战,因为相较于通用目标检测来说,文字具有多方向、不规则形状、极端长宽比、字体、颜色、背景多样等特点,因此,在通用目标检测上较为成功的算法无法直接迁移到文本检测中。虽然,随着深度学习技术的兴起,提出了一些文本检测方法,但是,对于较密集的文本,比如,小学生的算术练习,一张图像上有100个文本区域,此时,现有方法的处理速率则会随着文本框数量的增长,而线性下降,因此,无法满足实际应用场景的需求,降低了用户体验。
发明内容
本申请实施例提供一种文本检测方法、装置、设备及存储介质,以解决相关技术存在的问题,技术方案如下:
第一方面,本申请实施例提供了一种文本检测方法,包括:
获取待识别文本图像的初始特征图像,其中,所述待识别文本图像包含有多个文本区域;
将所述初始特征图像经由包含多个通道的预设模型进行特征提取,得到针对所述多个通道的目标特征图像,其中,所述目标特征图像中所述多个通道的第一通道提取的特征信息表征文本区域概率图,所述文本区域概率图指示所述初始特征图像中各像素点属于文本区域的概率,所述多个通道中除所述第一通道以外的所有其他通道提取的总特征信息表征文本区域所对应的像素点的总编码值,相同文本区域对应的像素点的总编码值相同,不同文本区域之间的像素点的总编码值不同;
基于所述文本区域概率图所表征的各像素点的概率值,以及基于所有其他通道所提取的总编码值,确定出所述待识别文本图像中各像素点所对应的特征值,以确定出所述待识别文本图像的多个文本区域。
在一种实施方式中,所述初始特征图像是所述待识别文本图像经由预设网络、PFEM、卷积操作、反卷积操作后所得到的、与所述待识别文本图像的图像大小相同的特征图像。
在一种实施方式中,所述多个通道中除所述第一通道以外的其他通道提取的表征文本区域所对应的像素点的编码值为0或1;所述总编码值为采用二进制码方式对各所述其他通道提取的编码值进行组合后所得到包含有0和/或1的数串,所述数串的位数与所述其他通道的通道数量相关。
在一种实施方式中,还包括:
对所述文本区域概率图进行二值化处理,得到二值图;
将以二进制码表征的所述总编码值转化为十进制码,得到各像素点对应的十进制值;
其中,所述基于所述文本区域概率图所表征的各像素点的概率值,以及基于所有其他通道所提取的总编码值,确定出所述待识别文本图像中各像素点所对应的特征值,包括:
将所述文本区域概率图对应的二值图中各像素点对应的值,与各像素点的十进制值进行与操作,得到所述待识别文本图像中各像素点所对应的特征值。
在一种实施方式中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110005121.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水环境污染溯源系统
- 下一篇:一种高性能三轴联动自动焊接设备的夹持机构