[发明专利]一种基于非负矩阵分解的离线中文字符识别方法无效
申请号: | 201110005677.0 | 申请日: | 2011-01-12 |
公开(公告)号: | CN102073871A | 公开(公告)日: | 2011-05-25 |
发明(设计)人: | 谭军 | 申请(专利权)人: | 广州市伟时信息系统技术有限公司;谭军 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州知友专利商标代理有限公司 44104 | 代理人: | 宣国华 |
地址: | 510275 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 矩阵 分解 离线 中文 字符 识别 方法 | ||
1.一种基于非负矩阵分解的离线中文字符识别方法,其特征在于包括如下步骤:
(a)对训练集字符图像中的每个字符图像进行预处理,使字符位于字符图像的居中位置;
(b)对步骤(a)处理后的训练集字符图像进行字符集向量非负矩阵分解,获得部首基;
(c)对需要识别的测试集字符图像中的每个字符图像进行预处理,使字符位于字符图像的居中位置;
(d)将步骤(c)处理后的测试集字符图像在部首基上做投影,并获得投影系数;
(e)根据投影系数识别所述测试集字符图像中每个字符图像中的字符所对应的文字。
2.根据权利要求1所述的一种基于非负矩阵分解的离线中文字符识别方法,其特征在于:所述的步骤(a)和(e)中对字符图像进行预处理的过程为:
(a1)获取所述字符图像的外框参数和所述字符的外框参数;所述字符图像和字符的外框参数包括高度和宽度;
(a2)根据(a1)所得的参数值,计算所述字符在字符图像的居中位置参数,所述居中位置参数为:当所述字符位于居中位置时,所述字符图像的外框与所述字符的外框之间的间距;
(a3)根据(a1)和(a2)所得的参数值,将字符位移到所述字符图像的居中位置。
3.根据权利要求2所述的一种基于非负矩阵分解的离线中文字符识别方法,其特征在于:所述步骤(a1)中字符图像的外框的高度和宽度为所述字符图像的矩阵的高度Hi和宽度Wi,所述字符图像的矩阵是指构成所述字符图像的像素在整幅训练集/测试集图像中的像素坐标值所构成的矩阵。
4.根据权利要求2所述的一种基于非负矩阵分解的离线中文字符识别方法,其特征在于:所述步骤(a1)中字符的外框参数获取过程为:将字符图像转换成为二值图,所述二值图中的背景像素的值设为0;前景像素的值设为1;再对所述字符图像逐行扫描,遇到值为1的像素点则记录下来该像素点的坐标(x,y),扫描完成后通过比较找到坐标(x,y)中的x方向和y方向上的最大和最小值,一共四个值:最小的ymin计为T(Top),最小的xmin计为L(Left),最大的xmax计为R(Right),最小的ymax计为B(Bottom),则所述字符的外框参数为:Hc=ymax-ymin,Wc=xmax-xmin,其中Hc为高度、Wc为宽度。
5.根据权利要求2所述的一种基于非负矩阵分解的离线中文字符识别方法,其特征在于:所述步骤(a2)中的字符图像的外框与字符的外框之间的间距包括上边距DT和左边距DL∶DT=(Hi-Hc)/2,DL=(Wi-Wc)/2,其中Hi和Wi为字符图像的外框的高度和宽度,Hc和Wc为字符的外框的高度和宽度。
6.根据权利要求2所述的一种基于非负矩阵分解的离线中文字符识别方法,其特征在于:所述步骤(a3)中字符位移时的参数为:Mx=DL-xmin,My=DT-ymin,其中Mx,My分别为水平移动距离和垂直方向移动距离;其中Mx>0,则左移,否则右移;My>0,则上移,否则下移,DT和DL分别为字符图像的外框与字符的外框之间的上边距和左边距,xmin和ymin分别为所述字符的像素坐标(x,y)中x方向和y方向上的最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市伟时信息系统技术有限公司;谭军,未经广州市伟时信息系统技术有限公司;谭军许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110005677.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:确定与感兴趣地下体积有关的地质信息的方法
- 下一篇:机动平地机