[发明专利]一种图形表格的定位分割方法及装置有效
申请号: | 202010558758.2 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111611783B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 钟琴隆;杜志诚;于文才;杜明本 | 申请(专利权)人: | 山东旗帜信息有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06T5/30;G06T7/11;G06V30/413 |
代理公司: | 济南千慧专利事务所(普通合伙企业) 37232 | 代理人: | 赵长林 |
地址: | 250000 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图形 表格 定位 分割 方法 装置 | ||
一种图形表格的定位分割方法及装置,包括如下步骤:将图形表格进行二值化处理得到第一图形;将第一图形进行形态学腐蚀膨胀,确定第一图形中的表格组成线得到第一表格;将第一表格进行高斯模糊和二值化处理得到第二图形;将第二图形再进行形态学腐蚀膨胀,然后基于第二图形确定表格组成线分割图形表格。本申请采用两次二值化处理和两次形态学腐蚀膨胀,将图形表格的组成线进行了有效处理;第一次二值化是图片变成黑白,能够分离目标区域和背景区域,减少干扰,方便后面处理,第二次二值化是再次二值化后,再膨胀的话能够把表格线加粗及对虚线、细线、断线能够做一个补全,提高表格区域块定位的准确度。
技术领域
本申请涉及一种图形表格的定位分割方法及装置。
背景技术
在实际的生产生活中,尽管大多数表格都是由电子生成,但是其呈现形式却多是pdf、图片等不可编辑模式,因此在使用中,需要进行图形表格的转换。现在多是采用电脑识别的方式进行,但在一些虚线、细线、断线等难识别部位,有较大的可能性产生识别错误,而此种错误,直接降低了识别结果的可用性,同时为后续的文字提取识别等工作带来了较大的不确定性。现在解决这一问题的方法是提供一种人为干预的接口,但这对于工作效率产生了较大的影响,且并未从根本上解决这一问题。
发明内容
为了解决上述问题,本申请一方面提出了一种图形表格的定位分割方法,包括如下步骤:将图形表格进行二值化处理得到第一图形;将第一图形进行形态学腐蚀膨胀,确定第一图形中的表格组成线得到第一表格;将第一表格进行高斯模糊和二值化处理得到第二图形;将第二图形再进行形态学腐蚀膨胀,然后基于第二图形确定表格组成线分割图形表格。本申请采用两次二值化处理和两次形态学腐蚀膨胀,将图形表格的组成线进行了有效处理;第一次二值化是图片变成黑白,能够分离目标区域和背景区域,减少干扰,方便后面处理,第二次二值化是再次二值化后,再膨胀的话能够把表格线加粗及对虚线、细线、断线能够做一个补全,提高表格区域块定位的准确度;而形态学腐蚀膨胀方法能够把图片中的文字消除,并且去除多余的干扰点或线,得到表格的横线及竖线,然后再通过横线竖线与运算把图片中的整个表格还原出来。
优选的,还包括图形表格预处理的过程,所述图形表格预处理包括获取图形表格的R通道图形。提取R通道能够将红色的印章排出掉,从而解决印章对表格线提取的干扰,因为印章覆盖到表格线上,会导致提取表格线出现一大段断线的情况,因此进行预处理之后,减少了干扰,比直接做图像灰度更有优势。
优选的,二值化处理采用自适应阈值进行处理;所述自适应阈值根据邻域块的像素值分布来确定该像素位置上的二值化阈值。在图像阈值化操作中,需要关注的是二值化图像中,去分离目标区域和背景区域,不同图片的背景不同,但是仅仅通过设定固定阈值很难达到理想的分割效果。而自适应阈值,则是根据像素的邻域块的像素值分布来确定该像素位置上的二值化阈值。这样做的优点:(1)每个像素位置处的二值化阈值不是固定不变的,而是由其周围邻域像素的分布来决定的。(2)亮度较高的图像区域的二值化阈值通常会较高,而亮度低的图像区域的二值化阈值则会相适应的变小。(3)不同亮度、对比度、纹理的局部图像区域将会拥有相对应的局部二值化阈值。(4)自适应阈值能够灵活处理各种图像,达到一个很好的效果。
优选的,获取第一表格之后,先进行颜色反转,然后再进行高斯模糊和二值化处理得到第二图形。
优选的,对于第二图形寻找轮廓以确定凸包,得到凸包坐标,并利用凸包坐标作为基点将图形表格进行分割得到待识别字块。
优选的,根据凸包坐标进行第二图形重绘得到表格。
优选的,所述重绘表格的过程如下:对得到的凸包坐标中左上角的Y坐标值进行排序和干扰值过滤,得到表格行数及每行的Y坐标值,再根据处理后的Y值对凸包坐标进行分类,每一类再根据X坐标值进行排序,得到每个凸包在原表格上的位置,即完成利用凸包坐标来还原原来的表格。本申请的寻找表格内的凸包相当于找表格区域块的内框,这样分割出来的文字块区域能够避免表格线干扰,可以提高OCR对于框内文字的识别准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东旗帜信息有限公司,未经山东旗帜信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010558758.2/2.html,转载请声明来源钻瓜专利网。