[发明专利]一种基于SWT的多方向中文印刷体文字检测方法有效
申请号: | 201810967087.8 | 申请日: | 2018-08-23 |
公开(公告)号: | CN109409356B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 张华熊;周一枫;胡洁;林翔宇;何利力;王玉平 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 swt 多方 中文 印刷体 文字 检测 方法 | ||
1.一种基于SWT的多方向中文印刷体文字检测方法,包括如下步骤:
(1)对待检测的图像依次进行灰度化以及缩放的预处理操作,
(2)对预处理后的图像进行倾斜校正,具体实现过程为:首先,对图像进行二维离散傅里叶变换,得到图像对应的频率分布图;然后,对该频率分布图中左上、右上、左下、右下四个角频率分布块进行象限交换及平移操作,将图像频谱从原点移动到图像中心点,使得四个角频率分布块均集中在频率分布图的中心;最后,对频率分布图进行二值化,通过霍夫线检测技术画出分布图中的倾斜角度线,进而根据该倾斜角度线对原图像进行倾斜校正;
(3)从经校正后的图像中提取文本行作为ROI,具体实现过程为:对校正后的图像进行水平投影处理得到图像的水平投影直方分布图,根据分布图当中文本行与空白行的间隔区间快速提取待检测处理的文本行作为ROI;若图像的倾斜角度在[-30°,30°]范围内,则提取图像中第一行文本作为ROI;若图像的倾斜角度超出[-30°,30°]范围,则提取图像中前三行文本作为ROI;
(4)对ROI进行canny边缘检测处理,提取文本行的文字边缘检测图;
(5)采用SWT算法对文字边缘检测图进行文本检测,得到包含文字笔画宽度信息的SWT图像;文本检测过程中所涉及的笔画宽度检索方向角满足以下条件:
其中:SwtDq为笔画宽度检索方向角;
(6)基于改进的SWT文本启发式规则对SWT图像中不符合中文文字特征的区域进行过滤,过滤后剩余保留下来的区域即为字符连通域;
改进的SWT文本启发式规则包含以下判别条件,满足该判别条件的区域即不符合中文文字特征;
其中:SwtVariance为区域内笔画宽度的方差,SwtMean为区域内笔画宽度的均值;
(7)对满足相关聚类条件的字符连通域聚类成行,形成文本行连通域;
(8)基于启发式规则对文本行连通域进行检测,从而识别待检测的图像是否为中文印刷体图像,即当以下两个条件同时满足的情况下,则判定待检测的图像为中文印刷体图像;
①
②s(h)≥10且s(w)≥30且
其中:Stext为文本行连通域中前景像素的面积,Srect为整个文本行连通域的面积,s(h)和s(w)分别为文本行连通域的高和宽。
2.根据权利要求1所述的多方向中文印刷体文字检测方法,其特征在于:所述步骤(1)中对待检测的图像进行缩放,使其缩放至650×850大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810967087.8/1.html,转载请声明来源钻瓜专利网。