[发明专利]一种文本图像倒置快速检测方法有效
申请号: | 201710090240.9 | 申请日: | 2017-02-20 |
公开(公告)号: | CN106909897B | 公开(公告)日: | 2020-03-13 |
发明(设计)人: | 王建;庞彦伟 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 倒置 快速 检测 方法 | ||
本发明涉及一种文本图像倒置快速检测方法,包括对输入的文本图像进行预处理,得到二值化处理结果用B;进行有效文本行检测,得到有效文本行序列;进行文本行分类,方法如下:1)对于有效文本行序列的各个有效文本行s,填充该有效文本行s相邻字符之间的空白;2)计算各个有效文本行s在垂直方向的投影值,用V(c)表示,其中c表示列序号;3)得到有效文本行s的左边界和右边界;4)得到有效文本行序列的左边界和右边界;5)判断“左缩进文本行”和“右缩进文本行”及“非缩进文本行”;文本图像倒置检测。
技术领域
本发明涉及文本图像增强技术,尤其是针对扫描文本图像的方向倒置检测技术。
背景技术
随着计算机技术的不断发展,基于OCR(光学字符识别)的文本图像数字化技术得到了广泛地应用。在完成OCR过程中,文本图像中的文字方向对字符识别性能影响至关重要。当文字存在倾斜时,如果不加以校正,会严重影响文字的识别率。特别是当文字存在倒置情况(即与正常方向偏差180°左右)。因此,在进行OCR之前,必须判断文本图像是否存在倒置情况,针对倒置情况应考虑首先进行旋转处理,以保证后续识别过程正常执行。
针对存在倾斜情况的文本图像,可以借助现有纠偏算法,检测倾斜度并进行相应地校正。但现有文本图像纠偏方法大都假定输入的文本图像倾斜度在一定范围之内,首先获取倾斜角度信息,进而完成倾斜度校正。但当输入文本图像完全倒置时,现有倾斜角度检测方法基本失效。曾凡锋等人提出了一种基于标点符号的文本图像倒置快速检测方法。该方法首先检测文本字符;然后结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点,判断标点符号类型;最后结合标点符号使用习惯,判断中文文本图像是否倒置。朱敏等人(专利公开号CN102831421A)提出一种基于标点符号的文本上下方向检测方法。该专利所提方法根据标点符号与文本行的相对位置属性来判断文本的方向,其基本思路与曾凡锋所提方法类似。这类基于标点符号的方法完全依靠标点特征,对于标点符号较少的文本图像无效,因此这类方法适用范围有限,不具有普遍性。
发明内容
本发明的目的是克服现有技术的上述不足,提供一种面向文本图像的方向倒置快速检测方法。技术方案如下:
一种文本图像倒置快速检测方法,包括下列步骤:
第一步:对输入的文本图像进行预处理,得到二值化处理结果用B;
第二步:进行有效文本行检测,得到有效文本行序列;
第三步:进行文本行分类,方法如下:
1)对于有效文本行序列的各个有效文本行s,使用矩形结构算子进行膨胀运算,填充该有效文本行s相邻字符之间的空白;
2)计算各个有效文本行s在垂直方向的投影值,用V(c)表示,其中c表示列序号;
3)统计满足条件V(c)>0.5×Rhei(s)的c取值,将c的最小值记为cmin,称为该有效文本行s的左边界;将最大值分别记为cmax,称为有效文本行s的右边界,该扫描行的长度为Rleg=cmax-cmin;
4)统计同一个有效文本行序列内各有效文本行对应的cmin(m)和cmax(m),将cmin(m)的最小值称为该有效文本行序列的左边界,记为clef;将cmax(m)的最大值称为该有效文本行序列的右边界,记为crgt;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710090240.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序