[发明专利]对文本图片OCR结果进行高准确率分行的方法有效
申请号: | 202011461822.1 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112396056B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 雷帮文 | 申请(专利权)人: | 杭州米数科技有限公司 |
主分类号: | G06V30/18 | 分类号: | G06V30/18;G06V30/148;G06F40/189;G06F40/289 |
代理公司: | 杭州融方专利代理事务所(普通合伙) 33266 | 代理人: | 沈相权 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图片 ocr 结果 进行 准确率 分行 方法 | ||
本发明公开了一种对文本图片OCR结果进行高准确率分行的方法。属于文本图片OCR准确率分行技术领域,提供一种易于对OCR结果进行高准确分行,可靠性高,方法的实现过程如下:开始,进行第一遍分行,取第一次分行的最优行,然后基于找到的最优行进行往上和往下再次分行,然后结合往上和往下分行的结果进行合并,最后得到分好行后的结果。
技术领域
本发明涉及文本图片OCR准确率分行技术领域,具体涉及一种对文本图片OCR结果进行高准确率分行的方法。
背景技术
目前对于非常标准、用人眼看起来就是从左到右、从上到下的文本图片的光学字符识别OCR(OpticalCharacterRecognition),要对其OCR结果进行分行,则非常简单,一般按照正常分行方法,从左到右、从上到下按x坐标和y坐标进行排序遍历,新的框距离最新的一行的距离超过某个阈值时,则是新的一行,否则是当前的行,依次遍历所有OCR结果框,即可分行。
但是对于实际场景中,图片往往大部分都存在扭曲、透视和旋转的问题,以上用于非常标准的图片的分行算法思路将不再适用。
发明内容
本发明是为了解决现在对OCR结果进行高准确分行不便,提供一种易于对OCR结果进行高准确分行,可靠性高的对文本图片OCR结果进行高准确率分行的方法。
为实现以上目的,本发明通过以下技术方案予以实现:
对文本图片OCR结果进行高准确率分行的方法,方法的实现过程如下:
步骤1,对OCR结果框依次进行x、y坐标递增排序;
步骤2,按排序后的顺序依次遍历OCR框,其中第一个框必定是第一行,也是最新的一行,记作L_1,读作第1行,以此类推,第N行记作L_n,读作第n行,最新的一行记作L_new;
步骤3,依次遍历接下来的OCR框,把遍历到的OCR框记作H框;尝试放到某一行中,尝试规则按步骤4执行;
步骤4,尝试把H框放到第L_(new-4)中,判定H框是否属于L(new-4),如果属于则放到该行,不属于则判定H框在L_(new-4)行的上一行还是在L_(new-4)行的下一行;如果是在L_(new-4)行的上一行则尝试放到L_(new-5)上,如果是在L_(new-4)行的下一行则尝试放到L_(new-3)上;
以此类推,如果判定到L_new的时候,H框任然处于L_new之下,则创建新行并把H框放到新创建的最新的行中,重复新的H框判定;判定一个H框是否属于某一行,按步骤5的规则判定执行;
步骤5,如果L_new的框个数不足两个或者该行的唯一一个框的宽高比不足5,则按步骤6处理,否则按步骤7步处理;
步骤6,取H框的往上和往下各15个OCR框的平均斜率作为对齐斜率,过H框的中点用此斜率虚拟出一条直线F,如果这条直线F过待判定的行距离H框最近的一个框的距离低于某个阈值,则H框属于该行,否则属于上一行或者下一行;
步骤7,取H框距离该行往上的一行最近的两个框的中点连接线斜率作为参考的直线F斜率,过H框的中点用此斜率虚拟出一条直线F,如果这条直线F过待判定的行距离H框最近的一个框的距离低于某个阈值,则H框属于该行,否则属于上一行或者下一行;
步骤8,经过上面7个步骤后,会得到第一版的分行结果,然后在分行结果中找出最优的一行,最优判定条件为,某行中两个邻近框的连接线斜率差最小,同时OCR框斜率差也为最小,则分行结果就为最优行;
步骤9,用最优行作为初始参考行,然后取最优行往上的所有OCR框和最优行往下的所有OCR框再次进行步骤1到步骤7后得到两份分行结果,然后再拼成一个完整分行结果,至此分行结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州米数科技有限公司,未经杭州米数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011461822.1/2.html,转载请声明来源钻瓜专利网。