[发明专利]一种图形表格的定位分割方法及装置有效
申请号: | 202010558758.2 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111611783B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 钟琴隆;杜志诚;于文才;杜明本 | 申请(专利权)人: | 山东旗帜信息有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06T5/30;G06T7/11;G06V30/413 |
代理公司: | 济南千慧专利事务所(普通合伙企业) 37232 | 代理人: | 赵长林 |
地址: | 250000 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图形 表格 定位 分割 方法 装置 | ||
1.一种图形表格的定位分割方法,其特征在于:包括如下步骤:
将图形表格进行二值化处理得到第一图形;
将第一图形进行形态学腐蚀膨胀,确定第一图形中的表格组成线得到第一表格;
将第一表格进行高斯模糊和二值化处理得到第二图形;
将第二图形再进行形态学腐蚀膨胀,然后基于第二图形确定表格组成线分割图形表格;
对于第二图形寻找轮廓以确定凸包,得到凸包坐标,并利用凸包坐标作为基点将图形表格进行分割得到待识别字块;
根据凸包坐标进行第二图形重绘得到表格;
所述重绘表格的过程如下:对得到的凸包坐标中左上角的Y坐标值进行排序和干扰值过滤,得到表格行数及每行的Y坐标值,再根据处理后的Y值对凸包坐标进行分类,每一类再根据X坐标值进行排序,得到每个凸包在原表格上的位置,即完成利用凸包坐标来还原原来的表格。
2.根据权利要求1所述的一种图形表格的定位分割方法,其特征在于:还包括图形表格预处理的过程,所述图形表格预处理包括获取图形表格的R通道图形。
3.根据权利要求1所述的一种图形表格的定位分割方法,其特征在于:二值化处理采用自适应阈值进行处理;所述自适应阈值根据邻域块的像素值分布来确定该像素位置上的二值化阈值。
4.根据权利要求1所述的一种图形表格的定位分割方法,其特征在于:获取第一表格之后,先进行颜色反转,然后再进行高斯模糊和二值化处理得到第二图形。
5.根据权利要求1所述的一种图形表格的定位分割方法,其特征在于:将得到的待识别字块进行OCR识别,得到其中的文字;将得到的文字置于重绘得到的表格中,即得到识别后的图形表格。
6.根据权利要求1所述的一种图形表格的定位分割方法,其特征在于:所述形态学腐蚀膨胀采用getStructuringElement算法进行图片处理,然后再利用MORPH_RECT函数得到矩形。
7.一种图形表格的定位分割装置,其特征在于:包括如下模块:
预处理模块,用于将图形表格进行二值化处理得到第一图形;
正向处理模块,用于将第一图形进行形态学腐蚀膨胀,确定第一图形中的表格组成线得到第一表格;
还原处理模块,用于将第一表格进行高斯模糊和二值化处理得到第二图形;将第二图形再进行形态学腐蚀膨胀,然后基于第二图形确定表格组成线分割图形表格;
所述还原处理模块,对于第二图形寻找轮廓以确定凸包,得到凸包坐标,并利用凸包坐标作为基点将图形表格进行分割得到待识别字块;
根据凸包坐标进行第二图形重绘得到表格;
所述重绘表格的过程如下:对得到的凸包坐标中左上角的Y坐标值进行排序和干扰值过滤,得到表格行数及每行的Y坐标值,再根据处理后的Y值对凸包坐标进行分类,每一类再根据X坐标值进行排序,得到每个凸包在原表格上的位置,即完成利用凸包坐标来还原原来的表格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东旗帜信息有限公司,未经山东旗帜信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010558758.2/1.html,转载请声明来源钻瓜专利网。