[发明专利]文本检测方法、电子设备及计算机可读介质有效
申请号: | 202010560807.6 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111709420B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 秦勇;李兵;张子浩 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/148;G06V30/18;G06V30/19;G06K9/62 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 电子设备 计算机 可读 介质 | ||
本发明实施例公开了一种文本检测方法、电子设备和计算机可读介质,其中,所述文本检测方法包括:对待检测文本图像进行特征提取和图像分割,至少获取所述待检测文本图像的文本区域概率图和所述待检测文本图像的图像特征;对所述文本区域概率图进行二值化,获得文本区域二值图;根据所述文本区域二值图和所述图像特征,获取至少一个文本连通域;获取至少一个所述文本连通域的文本区域近似边界;根据所述文本区域近似边界和预设的边界阈值,获得所述待检测文本图像的文本检测结果。通过本发明实施例,提高了文本检测尤其是密集文本检测的速度和效率。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种文本检测方法、电子设备和计算机可读介质。
背景技术
文本检测是一种检测图像中的文本区域并标记其边界框的技术,文本检测应用范围广泛,是很多计算机视觉任务的前置步骤,比如图像搜索、文字识别,身份认证和视觉导航等。
文本检测的主要目的是定位文本行或字符在图像中的位置,目前一种比较流行的文本检测方法是基于滑动窗口的文本检测方法。该方法基于通用目标检测的思想,设置大量不同长宽比、不同大小的锚点框,以这些锚点框为滑动窗口,在图像上或者在从图像上进行过卷积操作得到的特征映射图上进行遍历搜索,对于每个搜索到的位置框,进行框内是否是文本的分类判定。
但是,这种方法计算量过大,不仅需要耗费大量计算资源,而且耗时较长。
发明内容
本发明提供了一种文本检测方案,以至少部分解决上述问题。
根据本发明实施例的第一方面,提供了一种文本检测方法,包括:对待检测文本图像进行特征提取和图像分割,至少获取所述待检测文本图像的文本区域概率图和所述待检测文本图像的图像特征;对所述文本区域概率图进行二值化,获得文本区域二值图;根据所述文本区域二值图和所述图像特征,获取至少一个文本连通域;获取至少一个所述文本连通域的文本区域近似边界;根据所述文本区域近似边界和预设的边界阈值,获得所述待检测文本图像的文本检测结果。
根据本发明实施例的第二方面,提供了一种电子设备,所述设备包括:一个或多个处理器;计算机可读介质,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的文本检测方法。
根据本发明实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的文本检测方法。
根据本发明实施例提供的方案,在进行文本检测,尤其是文字密度较大的密集文本检测时,可以先根据对待检测文本图像的特征提取和图像分割的结果,获得文本区域概率图和待检测文本图像的图像特征;进而,对文本区域概率图进行二值化,获得相应的文本区域二值图;再基于该文本区域二值图和所述图像特征获得待检测文本图像中的一个或多个连通域;在获得连通域的文本区域近似边界后,可根据预设的边界阈值,获得文本检测结果,即具有各自边界的各个文本区域。一方面,本发明实施例提供的方案基于文本区域二值图进行处理,相较于其它形式的文本区域图像,待处理的数据量更少,处理速度更快,且可节省计算资源;另一方面,依据文本区域二值图对所述图像特征进行处理,可保留有用特征而过滤掉无用特征,进一步减少了计算量,节省了计算资源,且提升了计算速度;再一方面,基于获得的各个文本连通域的文本区域近似边界,根据预设边界阈值来进行准确的边界确认和划分,相较于通过模型进行文本框检测等方式,实现更为简单、快速、边界确定效率也更高,且也可减少计算量,降低计算资源消耗。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1A为根据本发明实施例一的一种文本检测方法的步骤流程图;
图1B为一种像素聚合网络PAN的结构示意图;
图1C为一种可微分二值化网络的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010560807.6/2.html,转载请声明来源钻瓜专利网。