[发明专利]基于OCR坐标的图片表格还原方法及系统有效
申请号: | 202111074953.9 | 申请日: | 2021-09-14 |
公开(公告)号: | CN113989823B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 刘大海 | 申请(专利权)人: | 北京左医科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/146;G06V30/19;G06T3/60;G06T5/10;G06F40/174;G06F40/18;G06F40/189 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 100044 北京市西城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ocr 标的 图片 表格 还原 方法 系统 | ||
1.一种基于OCR坐标的图片表格还原方法,其特征在于,所述方法包括:
获取图片表格的图像;
对所述图像进行旋转校正,获得正向图像;
对所述正向图像进行OCR识别,获得识别信息;所述识别信息包括:所述图像中每个识别目标、每个识别目标的坐标、每个识别目标的高度、每个识别目标的宽度和所述图像的旋转角度;其中,所述识别目标包括:单个字符,或由多个连续间隔小于预设间隔阈值的字符组成的字符块;
所述每个识别目标的坐标确定规则包括:规定原图片表格正向排列的左上角点位坐标为(0,0),按照图片像素,横坐标从左向右逐渐增加,纵坐标从上到下逐渐增加;
根据预设聚类算法和所述识别信息对所述图片表格进行对齐操作,获得表格信息,包括:
进行行对齐,包括:
根据所述图像中每个识别目标的坐标、每个识别目标的高度和每个识别目标的宽度进行每两个识别目标之间的纵向重叠比计算;
对比每两个识别目标之间的纵向重叠比与预设纵向重叠比阈值;
将纵向重叠比小于预设纵向重叠比阈值的两个识别目标归为一行,完成行对齐;
进行列对齐,包括:
根据所述识别信息获得模型特征,并根据预设聚类算法和所述模型特征进行聚类;
将聚类结果类别相同的数据归为同一列,完成列对齐;
选择不同的聚类算法,或选择同一聚类算法但不同参数,进行图片表格聚类,获得多个候选表格;
以每一行的行号作为索引,根据预设筛选算法在所述多个候选表格中筛选出对应的最佳行;包括:
提取所述多个候选表格每个行索引下的所有行结果;
使用预设聚类评估算法依次评估所述所有行结果中每一行的列对齐偏差值;
提取每一行对齐效果偏差值最小的候选表格中的对应行,作为表格信息中对应行索引的最佳行;包括:
以行号建立索引,遍历索引,取出各候选表格中每个候选表格里该行号对应的行,分别计算行内每个字符块的间隔,对间隔进行累加得到间隔和,计算间隔累加和除以该行单元格数量得到G,G最大的行作为筛选出的最佳行;
以每一行筛选出的最佳行组成表格信息;
根据预设需求填充并输出所述表格信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述图像进行旋转校正,获得正向图像,包括:
识别所述图像中的直线信息;
利用霍夫变换将所述直线信息调整为水平直线。
3.根据权利要求2所述的方法,其特征在于,所述对所述图像进行旋转校正中,旋转校正的校正角度范围为≤45°。
4.根据权利要求1所述的方法,其特征在于,所述根据所述识别信息获得模型特征包括:
根据所述每个识别目标的坐标和每个识别目标的宽度获得每个识别目标的左坐标和右坐标;
将所述每个识别目标的左坐标和/或所述每个识别目标的右坐标作为模型特征。
5.根据权利要求1所述的方法,其特征在于,所述使用聚类评估算法依次评估所述所有行结果中每一行的列对齐偏差值,包括:
使用多个不同预设聚类评估算法分别进行列对齐偏差值评估,获得多个评估结果;
利用预设加权算法进行所述多个评估结果综合分析,获得唯一列对齐偏差值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京左医科技有限公司,未经北京左医科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111074953.9/1.html,转载请声明来源钻瓜专利网。