[发明专利]文本检测方法和设备在审
申请号: | 201610115229.9 | 申请日: | 2016-03-01 |
公开(公告)号: | CN107145883A | 公开(公告)日: | 2017-09-08 |
发明(设计)人: | 张庆久;乐宁;吴波;江淑红 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38;G06K9/46 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 王波波 |
地址: | 日本国大阪府大阪*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 设备 | ||
技术领域
本发明涉及文本检测技术,更具体地,涉及一种从自然场景图像中检测文本的方法和设备,能够支持多语言,且能够检测水平行和垂直行。
背景技术
随着信息技术的发展,电子设备(例如,个人数字助理、手持电脑、手机)等的使用在人们的生活中越来越普及。配备有摄像装置的电子设备的使用也越来越普及。当人们通过摄像装置拍摄自然场景图像时,可能需要对所拍摄的图像中的文本行进行识别。
中国专利申请201410334436.4提出了一种中文文本定位设备,其可以从自然场景图像中提取文本。其中,通过最大稳定极值区域MSER方法对图像进行二值化,并根据中文字符的特征来检测文本。但是,所提取的文本局限于中文字符。
现有的文本检测方法局限于一种或某几种特定语言,而无法普适于所有语言。当在图像中出现未知语言时,得到的结果非常差。
此外,现有的文本检测方法通常仅能够处理水平行,而无法同时处理水平行和垂直行。
以高精度来检测自然场景图像中的文本非常困难。一方面,在图像中可能存在非常多的非文本内容,而这些内容可能导致大量噪声并降低检测精度。另一方面,真实世界中的文本具有各种各样的布局和大小,这种复杂的情况非常难以处理。
因此,需要一种能够支持多语言且能够检测水平行和垂直行的文本检测机制。
发明内容
本公开提出了一种文本检测方法和设备,能够支持多语言,且能够检测水平行和垂直行。
根据本发明的一个方面,提出了一种文本检测方法,包括:对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;对提取的连通域进行组合,以检测水平行和垂直行;以及针对检测到的结果进行滤波,以消除噪声。
优选地,通过最大稳定极值区域MSER方法对待检测的图像进行二值化。
优选地,所述连通域的特征至少包括以下之一:外界矩形;前景面积;前景面积与外界矩形的面积之比;笔画粗细;以及连通域的颜色。
优选地,在提取连通域之后,所述方法还包括:从提取的连通域中移除具有明显不属于文本的特征的连通域。
优选地,检测水平行和垂直行包括:先检测水平行,然后检测垂直行。
优选地,检测水平行包括:根据连通域的特征,将水平相距小于第一阈值的相邻的连通域组合为一个候选水平子行;根据第二阈值,将水平相距小于第二阈值的相邻的候选水平子行组合为一个候选水平行;将候选水平行中连通域的数量大于2的行作为水平行,并将剩余的行作为垂直行候选项。
优选地,检测垂直行包括:将垂直距离小于第三阈值的相邻的垂直行候选项组合为一个候选垂直子行;根据第四阈值,将垂直距离小于第四阈值的相邻的候选垂直子行组合为一个候选垂直行;将候选垂直行中连通域的数量大于或等于3的行作为垂直行。
优选地,针对检测到的结果进行滤波,以消除噪声包括:根据预设的噪声特征,识别检测到的结果中存在的具有预设的噪声特征的行,并从结果中移除所识别的行。
根据本发明的另一方面,提出了一种文本检测设备,包括:文本提取模块,被配置为对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;行检测模块,被配置为对提取的 连通域进行组合,以检测水平行和垂直行;以及后处理模块,被配置为针对检测到的结果进行滤波,以消除噪声。
与现有技术不同,根据本发明实施例的文本检测方法和设备在多个方面改善了文本检测的性能,至少包括:
1.不局限于某种或某些特定语言,而可以识别任何语言的文本行;
2.能够同时检测存在的水平行和垂直行;
3.可以以高精度定位文本行。
附图说明
通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
图1是示出了根据本发明实施例的文本检测设备的示意框图。
图2示出了一个示例的待检测的图像。
图3示出了图2所示的待检测的图像的二值化结果和连通域。
图4示出了图3所示的二值化结果中移除了明显不属于文本的特征的连通域后的结果。
图5示出了图2所示的待检测的图像的行检测结果。
图6示出了另一个示例的待检测的图像和行检测结果。
图7示出了根据本发明实施例的文本检测方法的流程图。
图8示出了利用根据本发明实施例的文本检测方法的一个应用示例。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610115229.9/2.html,转载请声明来源钻瓜专利网。