[发明专利]一种中文文字图片长干扰线去除方法在审

专利信息
申请号: 202010031900.8 申请日: 2020-01-13
公开(公告)号: CN111209912A 公开(公告)日: 2020-05-29
发明(设计)人: 龙华;段荧;邵玉斌;杜庆治 申请(专利权)人: 昆明理工大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/40;G06K9/46
代理公司: 昆明人从众知识产权代理有限公司 53204 代理人: 沈艳尼
地址: 650093 云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 中文 文字 图片 干扰 去除 方法
【权利要求书】:

1.一种中文文字图片长干扰线去除方法,其特征在于:

Step1:获取带有与文本颜色相同干扰线的文字图像;

Step2:对文字图像进行二值化的处理,并得到二值化图像;

Step3:确定初始扫描方向,获取与文字颜色一致的像素点;

Step4:依次扫描待测点,计算通过线段权值;

Step5:计算当前图片所有线段权值的均值,并储存初始图片所有连接线段的权值均值;

Step6:根据求取的干扰线段阈值,逐一判定当前线段是否属于干扰线段;

Step7:根据干扰线段上每个像素点的邻域特性,判定其与文字粘连情况后,对图片中的干扰像素点进行去除;

Step8:扫描已经处理好的图片,对图像之中的单行或者单列的像素点进行去除;

Step9:循环处理图片中的干扰线段,直至当前干扰线段的阈值小于Step5中所储存的初始图片所有连接线段权值的均值,则循环终止;

Step10:对最终处理好的图片进行储存并输出。

2.根据权利要求1所述的中文文字图片长干扰线去除方法,其特征在于:所述步骤Step1中,所获取的带有干扰线的文字图片,其干扰线特征为:与文字图片颜色相同,且干扰线的线性可为规则或不规则的连续线段,可与文字部分进行部分粘连,其长度应大于中文字符的长度。

3.根据权利要求1所述的中文文字图片长干扰线去除方法,其特征在于:所述步骤Step2中,对文字图像进行二值化处理,其处理过程为将一幅大小为m×n的文档图像等分成大小相等的块,假设等分成m1×n1个块,即列方向等分成m1份,行方向等分成n1份,则每块中像素的数目为(m×n)/(m1×n1),m1和n1的取值范围应为5~10之间的整数,每个小块中的局部阈值使用大津法获得,然后使用线性插值法从局部阈值获得每个位置的阈值T(i,j),图像二值化可以描述为:

4.根据权利要求1所述的中文文字图片长干扰线去除方法,其特征在于:所述步骤Step3中,确定扫描的方向为水平或者垂直,获取文字图像中文字的颜色,并获取所有与其颜色相同的像素点位置,并存于数组V:{v1,v2…vx}之中,其中x为所有待测像素点的数目,vx为该像素点的在图片之中的位置坐标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010031900.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top