[发明专利]一种中文文字图片长干扰线去除方法在审
申请号: | 202010031900.8 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111209912A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 龙华;段荧;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/40;G06K9/46 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 沈艳尼 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 文字 图片 干扰 去除 方法 | ||
1.一种中文文字图片长干扰线去除方法,其特征在于:
Step1:获取带有与文本颜色相同干扰线的文字图像;
Step2:对文字图像进行二值化的处理,并得到二值化图像;
Step3:确定初始扫描方向,获取与文字颜色一致的像素点;
Step4:依次扫描待测点,计算通过线段权值;
Step5:计算当前图片所有线段权值的均值,并储存初始图片所有连接线段的权值均值;
Step6:根据求取的干扰线段阈值,逐一判定当前线段是否属于干扰线段;
Step7:根据干扰线段上每个像素点的邻域特性,判定其与文字粘连情况后,对图片中的干扰像素点进行去除;
Step8:扫描已经处理好的图片,对图像之中的单行或者单列的像素点进行去除;
Step9:循环处理图片中的干扰线段,直至当前干扰线段的阈值小于Step5中所储存的初始图片所有连接线段权值的均值,则循环终止;
Step10:对最终处理好的图片进行储存并输出。
2.根据权利要求1所述的中文文字图片长干扰线去除方法,其特征在于:所述步骤Step1中,所获取的带有干扰线的文字图片,其干扰线特征为:与文字图片颜色相同,且干扰线的线性可为规则或不规则的连续线段,可与文字部分进行部分粘连,其长度应大于中文字符的长度。
3.根据权利要求1所述的中文文字图片长干扰线去除方法,其特征在于:所述步骤Step2中,对文字图像进行二值化处理,其处理过程为将一幅大小为m×n的文档图像等分成大小相等的块,假设等分成m1×n1个块,即列方向等分成m1份,行方向等分成n1份,则每块中像素的数目为(m×n)/(m1×n1),m1和n1的取值范围应为5~10之间的整数,每个小块中的局部阈值使用大津法获得,然后使用线性插值法从局部阈值获得每个位置的阈值T(i,j),图像二值化可以描述为:
4.根据权利要求1所述的中文文字图片长干扰线去除方法,其特征在于:所述步骤Step3中,确定扫描的方向为水平或者垂直,获取文字图像中文字的颜色,并获取所有与其颜色相同的像素点位置,并存于数组V:{v1,v2…vx}之中,其中x为所有待测像素点的数目,vx为该像素点的在图片之中的位置坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010031900.8/1.html,转载请声明来源钻瓜专利网。