[发明专利]字符识别后处理方法、设备及包括该设备的图像拾取设备有效
申请号: | 201410645514.2 | 申请日: | 2014-11-12 |
公开(公告)号: | CN105654082B | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 田雨 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 魏小薇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 处理 方法 设备 包括 图像 拾取 | ||
1.一种字符识别后处理方法,包括:
组件识别步骤,从字符行区域图像中提取组件并获得组件的识别结果;
顶点和底点获取步骤,获取各组件的与字符方向线的距离最大的顶点与底点;
消失点确定步骤,使用顶线和底线的交叉点来确定消失点,其中顶线是基于连接各组件的任两个顶点的线段中具有彼此相一致的斜率和截距的线段的顶点组而确定的,并且底线是基于连接各组件的任两个底点的线段中具有彼此相一致的斜率和截距的线段的底点组确定的;
基线确定步骤,基于所确定的消失点来确定至少两条基线;以及
字符校正步骤,基于所确定的基线来校正所述识别结果。
2.根据权利要求1所述的方法,其中,顶点和底点获取步骤还包括:
中心点确定步骤,确定所有组件的中心点;以及
字符方向线获取步骤,使用所确定的中心点通过线性拟合方法获取字符方向线。
3.根据权利要求1所述的方法,其中,顶点和底点获取步骤还包括:
属性设置步骤,基于识别结果来针对每个组件设置与基线级别有关的属性;
组件选择步骤,选择具有相同属性的至少两个组件;以及
字符方向线获取步骤,使用所选组件的中心点通过线性拟合方法获取字符方向线。
4.根据权利要求1-3之一所述的方法,其中,消失点确定步骤还包括:
主角度确定步骤,计算连接任两个顶点的线段的角度并选择包含最大线段数量的角度范围作为主角度范围;
顶点组确定步骤,根据主角度范围来确定所述顶点组;以及
顶线获取步骤,基于所述顶点组通过线性拟合方法来获取顶线。
5.根据权利要求4所述的方法,其中,顶点组确定步骤还包括:
顶点记录步骤,选择其角度在主角度范围内的线段的顶点及这些顶点在这些线段中的出现次数;
第一分割线获取步骤,通过使用所记录的顶点并把出现次数作为权重进行线性拟合来获取第一分割线;以及
顶点组选择步骤,从第一分割线将所记录的顶点划分出的第一组和第二组中选择顶点出现次数较多的组作为所述顶点组。
6.根据权利要求5所述的方法,其中,在顶线获取步骤中把出现次数作为权重进行线性拟合来获取顶线。
7.根据权利要求4所述的方法,其中,顶点组确定步骤还包括:
构图步骤,以连接任何两个顶点的线段为边并且以这些线段的角度与主角度范围之间的差为权重来构图;
求解最大割步骤,对图应用最大割求解方法以获得两个顶点组,使得每一组内各顶点对的权重之和最小化,两组之间各顶点对的权重之和最大化;以及
顶点组选择步骤,从这两个顶点组中选择角度在主角度范围中的线段中的顶点的出现次数较多的组作为所述顶点组。
8.根据权利要求1-3之一所述的方法,其中,基线确定步骤还包括:
第一基线确定步骤,基于消失点和各组件的顶点来确定基线1和基线2;
第二基线确定步骤,基于消失点和各组件的底点来确定基线3和基线4;
判断步骤,判断基线1和2或基线3和4是否应组合;以及
组合步骤,在判断结果为肯定的情况下组合基线。
9.根据权利要求8所述的方法,其中,第一基线确定步骤还包括:
第二分割线获取步骤,基于所有顶点和消失点来获取满足以下条件的第二分割线:通过消失点;从每个顶点到该第二分割线的距离的平方和最小;
基线1确定步骤,基于第二分割线之上的第一顶点组和消失点来确定满足以下条件的基线1:通过消失点;从第一顶点组中的每个顶点到该基线1的距离的平方和最小;以及
基线2确定步骤,基于第二分割线之下的第二顶点组和消失点来确定满足以下条件的基线2:通过消失点;从第二顶点组中的每个顶点到基线2的距离的平方和最小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410645514.2/1.html,转载请声明来源钻瓜专利网。