[发明专利]一种图像识别中倾斜文字判断方法有效
申请号: | 201510608915.5 | 申请日: | 2015-09-22 |
公开(公告)号: | CN105590112B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 陈炳章;何宏靖;刘世林;吴雨浓 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 倾斜 文字 判断 方法 | ||
1.一种图像识别中倾斜文字判断方法,其特征在于,包含以下实现步骤:
(1-1)在图像中选择一行向量,确定该行向量与图像中文字笔画相交的最左侧像素点和最右侧像素点坐标值;
(1-2)以所述行向量与每个笔画相交的最左侧像素点为起点,向左上方追踪对应笔画的边缘点,并将判断结果存于Vector1中;
追踪笔画边缘点包含以下步骤:
以行向量与每个相交笔画的最左侧像素点为起点,优先判断与其相邻的左上方像素点是否为0;
如果为0,则以上一像素点为基础,判断与其相邻的左上方像素点是否为0;
否则,以上一像素点为基础判断与其相邻的正上方像素点是否为0;
依次循环,直到某点相邻的左上方像素点和正上方像素点均不为0,结束判断,并将该点作为此次判断的终点;
(1-3)以所述行向量与每个笔画相交的最右侧像素点为起点,向右上方追踪对应笔画的边缘点,并将判断结果存于Vector2中;
追踪笔画边缘点包含以下步骤:
以行向量与每个相交笔画的最右侧像素点为起点,优先判断与其相邻的右上方像素点是否为0;
如果为0,则以上一像素点为基础判断与其相邻的右上方像素点是否为0;
否则,以上一像素点为基础判断与其相邻的正上方的像素点是否为0;
依次循环,直到某点相邻的右上方像素点和正上方像素点均不为0,结束判断,并将该点作为此次判断的终点;
所述步骤(1-2)和(1-3)中计算每次追踪起点到终点的距离h,如果h≥Q,则判定该次笔画追踪有效,其中Q为判断阈值;
(1-4)比较Vector1与Vector2的元素个数的多少;如果Vector1>Vector2,则判定文字向左倾斜;如果Vector1<Vector2,则判定文字向右倾斜。
2.如权利要求1所述的图像识别中倾斜文字判断方法,其特征在于,还包含步骤:
(1-5)将在所述Vector1与所述Vector2相比元素较多的类中,选择其中最小的倾斜角度作为图像文字的倾斜角度。
3.如权利要求2所述的图像识别中倾斜文字判断方法,其特征在于,所述步骤(1-2)与所述步骤(1-3)的顺序可以调换。
4.一种图像识别中倾斜文字的矫正方法,其特征在于,在权利要求1至3之一的基础上,用仿射变换的方法将倾斜文字矫正。
5.如权利要求4所述的一种图像识别中倾斜文字的矫正方法,其特征在于,包含以下实现步骤:
(2-1)在源图像上选择3组坐标值,根据方向和倾斜角度计算出矫正后对应的坐标值;
(2-2)根据目标图像和源图像对应的坐标关系,计算出对应的仿射变换矩阵M;
(2-3)利用所述仿射变换矩阵M将源图像映射到目标图像上,实现倾斜文字矫正。
6.如权利要求5所述的一种图像识别中倾斜文字的矫正方法,其特征在于,所述步骤(2-2)采用getAffineTransform函数来计算仿射变换矩阵M。
7.如权利要求5所述的一种图像识别中倾斜文字的矫正方法,其特征在于,所述步骤(2-3)中采用warpAffine函数来实现倾斜文字的矫正计算。
8.如权利要求5至7之一所述的一种图像识别中倾斜文字的矫正方法,其特征在于,若文字向左倾斜θ,所述步骤(2-1)中源图像中所选取的3组坐标值为:(0,0),(image.cols-1,0),(0,image.rows-1),目标图像上的对应坐标值为:(0,0),(image.cols-1-((image.rows-1)*tanθ/2),0),((image.rows-1)*tanθ/2,image.rows-1)。
9.如权利要求5至7之一所述的一种图像识别中倾斜文字的矫正方法,其特征在于,若文字向右倾斜θ,所述步骤(2-1)中源图像中所选取的3组坐标值为:(0,0),(image.cols-1,0),(image.cols-1,image.rows-1);目标图像上的三组坐标为:((image.rows-1)*tanθ/2,0),(image.cols-1,0),(image.cols-1-(image.rows-1)*tanθ/2,image.rows-1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510608915.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序