[发明专利]在保留交叉字符笔划的同时去除文档图像中的下划线和表格线有效
申请号: | 201410398898.2 | 申请日: | 2014-08-14 |
公开(公告)号: | CN104376318B | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 巫朝红 | 申请(专利权)人: | 柯尼卡美能达美国研究所有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/20 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 李芳华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种在保留与文档图像中的水平和垂直线交叉的字符笔划的完整性的同时、去除这些线的方法。对于每一检测的水平线,计算垂直游程长度分布图。检测具有其间具有山谷的两个相邻山峰的游程长度分布图的区域,所述区域对应于水平线与非垂直线的交叉。可使用一阶导数曲线来检测这样的山峰和山谷。也检测用于连续像素地点的具有大游程长度值的游程长度分布图的区域,所述区域对应于水平线与接近垂直线的交叉。在保留交叉区域中的像素的同时,在交叉区域之外的区域中去除水平线。可类似地进行垂直线去除。该无模板方法能去除表格、制表和下划线中的线,并提取手写或打印字符。 | ||
搜索关键词: | 保留 交叉 字符 笔划 同时 去除 文档 图像 中的 下划线 表格 | ||
【主权项】:
一种用于处理包括沿第一方向延伸的直线的文档图像的方法,该方法包括:(a)标识沿第一方向延伸的直线;(b)计算用于该线的游程长度分布图,该游程长度分布图是作为沿着该线的第一方向的位置的函数的游程长度值,其中给定位置处的每一游程长度值是包括该线中的非白像素的、沿着与第一方向正交的第二方向延伸的多个连续非白像素;(c)通过检测该游程长度分布图的第一类特性特征,来检测该线的第一类交叉区域的集合,所述第一类特性特征中的每一个包括山谷、和在预定义距离内位于山谷两侧的两个山峰,每一山峰和山谷的游程长度值之间的差大于第一阈值;(d)通过检测该游程长度分布图的第二类特性特征,来检测该线的第二类交叉区域的集合,所述第二类特性特征中的每一个包括其中游程长度值大于第二阈值的多个连续位置;和(e)在保留所述第一和第二类交叉区域中的线的同时,去除所述第一和第二类交叉区域外的区域中的线。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柯尼卡美能达美国研究所有限公司,未经柯尼卡美能达美国研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410398898.2/,转载请声明来源钻瓜专利网。