[发明专利]文本检测方法和设备在审
申请号: | 201610115229.9 | 申请日: | 2016-03-01 |
公开(公告)号: | CN107145883A | 公开(公告)日: | 2017-09-08 |
发明(设计)人: | 张庆久;乐宁;吴波;江淑红 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38;G06K9/46 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 王波波 |
地址: | 日本国大阪府大阪*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 设备 | ||
1.一种文本检测方法,包括:
对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;
对提取的连通域进行组合,以检测水平行和垂直行;以及
针对检测到的结果进行滤波,以消除噪声。
2.根据权利要求1所述的文本检测方法,其中,通过最大稳定极值区域MSER方法对待检测的图像进行二值化。
3.根据权利要求1所述的文本检测方法,其中,所述连通域的特征至少包括以下之一:
外界矩形;
前景面积;
前景面积与外界矩形的面积之比;
笔画粗细;以及
连通域的颜色。
4.根据权利要求1所述的文本检测方法,其中,在提取连通域之后,所述方法还包括:
从提取的连通域中移除具有明显不属于文本的特征的连通域。
5.根据权利要求1所述的文本检测方法,其中,检测水平行和垂直行包括:
先检测水平行,然后检测垂直行。
6.根据权利要求5所述的文本检测方法,其中,检测水平行包括:
根据连通域的特征,将水平相距小于第一阈值的相邻的连通域组合为一个候选水平子行;
根据第二阈值,将水平相距小于第二阈值的相邻的候选水平子行组合为一个候选水平行;
将候选水平行中连通域的数量大于2的行作为水平行,并将剩余的行作为垂直行候选项。
7.根据权利要求6所述的文本检测方法,其中,检测垂直行包括:
将垂直距离小于第三阈值的相邻的垂直行候选项组合为一个候选垂直子行;
根据第四阈值,将垂直距离小于第四阈值的相邻的候选垂直子行组合为一个候选垂直行;
将候选垂直行中连通域的数量大于或等于3的行作为垂直行。
8.根据权利要求1所述的文本检测方法,其中,针对检测到的结果进行滤波,以消除噪声包括:
根据预设的噪声特征,识别检测到的结果中存在的具有预设的噪声特征的行,并从结果中移除所识别的行。
9.一种文本检测设备,包括:
文本提取模块,被配置为对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;
行检测模块,被配置为对提取的连通域进行组合,以检测水平行和垂直行;以及
后处理模块,被配置为针对检测到的结果进行滤波,以消除噪声。
10.根据权利要求9所述的文本检测设备,其中,所述文本提取模块被配置为通过最大稳定极值区域MSER方法对待检测的图像进行二值化。
11.根据权利要求9所述的文本检测设备,其中,所述连通域的特征至少包括以下之一:
外界矩形;
前景面积;
前景面积与外界矩形的面积之比;
笔画粗细;以及
连通域的颜色。
12.根据权利要求9所述的文本检测设备,其中,所述文本检测模块还被配置为:
从提取的连通域中移除具有明显不属于文本的特征的连通域。
13.根据权利要求9所述的文本检测设备,其中,所述行检测模块被配置为:
先检测水平行,然后检测垂直行。
14.根据权利要求13所述的文本检测设备,其中,所述行检测模块被配置为:
根据连通域的特征,将水平距离小于第一阈值的相邻的连通域组合为一个候选水平子行;
根据第二阈值,将水平距离小于第二阈值的相邻的候选水平子行组合为一个候选水平行;以及
将候选水平行中连通域的数量大于2的行作为水平行,并将剩余的行作为垂直行候选项。
15.根据权利要求14所述的文本检测设备,其中,所述行检测模块被配置为:
将垂直距离小于第三阈值的相邻的垂直行候选项组合为一个候选垂直子行;
根据第四阈值,将垂直距离小于第四阈值的相邻的候选垂直子行组合为一个候选垂直行;以及
将候选垂直行中连通域的数量大于或等于3的行作为垂直行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610115229.9/1.html,转载请声明来源钻瓜专利网。