[发明专利]基于多特征融合的实时手写体数字识别方法有效
申请号: | 201410262086.5 | 申请日: | 2014-06-12 |
公开(公告)号: | CN103996057B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 张鸿;马彩云 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06K9/80 | 分类号: | G06K9/80 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙)33231 | 代理人: | 张宇娟 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多特征融合的实时手写体数字识别方法。首先对手写体数字图像数据库中的图像,进行预处理,包括黑白二值化、截取数字部分、图像调整、归一化、细化;再对预处理后的图像进行结构特征和统计特征的提取并融合,得到特征向量集;进而利用反向传播神经网络进行训练学习。该基于多特征融合的实时手写体数字识别方法既保留了结构特征和统计特征中的鉴别信息,又在一定程度上消除了冗余信息,使每个手写体数字类别的特性更加明显,更易于区分,得到了较好的识别结果。 | ||
搜索关键词: | 基于 特征 融合 实时 手写体 数字 识别 方法 | ||
【主权项】:
一种基于多特征融合的实时手写体数字识别方法,其特征在于包括如下步骤:第一步、手写体数字图像的预处理(1)对手写体数字图像I,转化成256灰度级的位图格式,并进行黑白二值化处理,得到二值图像,用I1表示;(2)截取二值图像I1中的手写体数字部分,使手写体数字居于正中间,得到数字居中图像I2;(3)计算数字居中图像I2的宽度W与长度H的比例W/H,以及白色像素点数量W_Num与总像素点数量S_Num的比例W_Num/S_Num,如果W/H低于阈值R1,则对图像的宽度W做出调整,如果W_Num/S_Num低于阈值R2,则对图像I2做膨胀运算,用I3表示调整形状后的图像;(4)将调整形状后的图像I3缩放到N×N个像素点,并再次二值化,得到归一化图像,再对归一化图像做细化处理并消除小分支,得到预处理图像I4;第二步、手写体数字图像的结构特征和统计特征提取(1)在结构特征上,提取过程如下:分别计算预处理图像I4在竖直方向的三个位置处的白色像素点的个数,得到3个特征值;分别计算预处理图像I4在水平方向的三个位置处的白色像素点的个数,得到3个特征值;分别计算预处理图像I4在左对角线和右对角线处的白色像素点的个数,得到2个特征值;分别计算预处理图像I4的端点数和四叉点数,得到2个特征值;将上述特征值组合成维度为1×10的结构特征向量T1;(2)在统计特征上,提取过程如下:将预处理图像I4平均分成8区域,统计每个区域的白色像素点数量,得到8个特征值P1,P2,…,P8;将预处理图像I4平均分成4区域,统计每个区域的白色像素点数量,得到4个特征值P9,P10,P11,P12;将预处理图像I4纵向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值P13,P14;将预处理图像I4横向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值P15,P16;将预处理图像I4横向平均分成3区域,统计中间区域的白色像素点数量,得到1个特征值P17;统计整个预处理图像I4的白色像素点数量,得到1个特征值P18;将特征值P1,P2,…,P18组成维度为1×18的统计特征向量T2;第三步、手写体数字图像的结构特征和统计特征融合(1)根据第一步,对手写体数字图像数据库中所有的K幅图像做预处理再根据第二步,对每幅预处理后的图像提取结构特征和统计特征,得到维度为K×10的结构特征向量集S和维度为K×18的统计特征向量集T;(2)对结构特征向量集S做归一化处理;(3)对统计特征向量集T做归一化处理;(4)将归一化后的结构特征向量集S和统计特征向量集T,按行拼接并转置后得到维度为28×K的融合特征向量集S_T;所述结构特征向量集S和统计特征向量集T的每个特征值的归一化由以下公式处理得到:a、求出结构特征向量集S的最大值max_S与最小值min_S,对结构特征向量集S中的数据做归一化处理,归一化函数如下:Sij=(Sij‑min_S)/(1+max_S‑min_S) (2)式(2)中Sij表示结构特征向量集S中的第i行第j个数据,i的取值范围是[1,K]的整数,j的取值范围是[1,10]的整数;b、求出统计特征向量集T的最大值max_T最小值min_T,对统计特征向量集T中的数据做归一化处理,归一化函数如下:Tij=(Tij‑min_T)/(1+max_T‑min_T) (3)式(3)中Tij表示统计特征向量集T中的第i行第j个数据,i的取值范围是[1,K]的整数,j的取值范围是[1,18]的整数;第四步、基于反向传播神经网络的识别模型(1)设置反向传播神经网络的参数,包括学习速率,动量因子,最大训练次数,以及性能目标值;(2)用维度为4的向量表示手写体数字类别,设置融合特征向量集S_T的每个特征向量对应的手写体数字类别向量,随机选择融合特征向量集S_T的一部分作为训练样本集,余下的部分作为测试样本集,对反向传播神经网络进行多次训练和测试,并保存检验结果最好的反向传播神经网络;第五步、新手写体数字图像的识别将用户输入的待识别的手写体数字图像,按照第一步至第三步的方法进行处理,得到维度为28×1的融合特征向量,将其输入到第四步中的反向传播神经网络进行识别,得到4×1的输出向量,将该输出向量转置并四舍五入,得到维度为4的向量即为该待识别的手写体数字的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410262086.5/,转载请声明来源钻瓜专利网。