[发明专利]一种文本图像倒置快速检测方法有效
申请号: | 201710090240.9 | 申请日: | 2017-02-20 |
公开(公告)号: | CN106909897B | 公开(公告)日: | 2020-03-13 |
发明(设计)人: | 王建;庞彦伟 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 倒置 快速 检测 方法 | ||
1.一种文本图像倒置快速检测方法,包括下列步骤:
第一步:对输入的文本图像进行二值化处理,得到二值化处理结果B;
第二步:进行有效文本行检测,得到有效文本行序列,方法如下:
1)计算B中各行在水平方向的投影值,用H(r)表示,其中r表示行号序号;
2)计算H(r)的最大值,用Hmax表示;
3)对于第r扫描行,如果满足H(r)>0.5×Hmax,则将该行判为一个有效扫描行;
4)统计各有效扫描行的分布情况,如果检测到连续m行被判为有效扫描行,且满足m>M/100,M是文本图像的高度即扫描总行数,则由这连续m个有效扫描行组成一个有效文本行序列;
确定该有效文本行序列中最上方和最下方有效扫描行的行号,用Rtop(s)和Rbot(s)分别表示该有效文本行序列的上下边界,定义该有效文本行序列的高度为Rhei(s)=|Rtop(s)-Rbot(s)|,符号|·|表示取绝对值符号,式中s是有效文本行的序号;
第三步:进行文本行分类,方法如下:
1)对于有效文本行序列的各个有效文本行s,使用矩形结构算子进行膨胀运算,填充该有效文本行s相邻字符之间的空白;
2)计算各个有效文本行s在垂直方向的投影值,用V(c)表示,其中c表示列序号;
3)统计满足条件V(c)>0.5×Rhei(s)的c取值,Rhei(s)为有效文本行s的高度,将c的最小值记为cmin(m),称为该有效文本行s的左边界;将最大值分别记为cmax(m),称为有效文本行s的右边界,该扫描行的长度为Rleg=cmax(m)-cmin(m);
4)统计同一个有效文本行序列内各有效文本行对应的cmin(m)和cmax(m),将cmin(m)的最小值称为该有效文本行序列的左边界,记为clef;将cmax(m)的最大值称为该有效文本行序列的右边界,记为crgt;
5)对于某有效文本行m,如果满足0.6<|cmin(m)-clef|/|cmax(m)-cmin(m)|<0.9,则将该有效文本行m判为“左缩进文本行”;如果满足0.6<|crgt-cmax(m)|/(cmax(m)-cmin(m))<0.9,则将该有效文本行m判为“右缩进文本行”;如果上述两个条件都不满足,则将该文本行判为“非缩进文本行”;
第四步:文本图像倒置检测,方法如下:
统计单幅文本图像中左缩进文本行和右缩进文本行的数目,分别用Nlef和Nrgt表示;使用下式判断文本图像是否存在倒置:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710090240.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序