[发明专利]基于多特征融合和深度学习网络提取的手写数字识别方法在审
申请号: | 201710093707.5 | 申请日: | 2017-02-21 |
公开(公告)号: | CN106874879A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 李乡儒 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 江裕强 |
地址: | 510631 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 融合 深度 学习 网络 提取 手写 数字 识别 方法 | ||
技术领域
本发明涉及手写数字识别技术领域,具体涉及基于多特征融合和深度学习网络提取的手写数字识别方法。
背景技术
手写数字识别在学科上属于模式识别和人工智能的范畴,是光学字符识别技术的一个分支,主要研究如何利用电子计算机自动辨认手写的阿拉伯数字。随着经济的飞速发展,逐渐信息化的社会在各个方面都要与数字打交道,一个准确率高的手写数字的识别方法在此时就显得尤为重要。
虽然手写数字的类别只有10种,且其识别已经研究了很长时间,并取得很大的进展,但是如今的手写数字的识别精度还有需进一步提高。
发明内容
本发明针对现有技术的不足,提供基于多特征融合和深度学习网络提取的手写数字识别方法,具体技术方案如下。
基于多特征融合和深度学习网络提取的手写数字识别方法,其包括如下步骤:
步骤1:读入手写数字的图像数据,对数据进行向量化预处理;
步骤2:对上一步骤的输出数据采用主成分分析(PCA)技术和方向梯度直方图(HOG)技术进行多特征融合,构造浅层复合特征;
步骤3:对多特征融合后的数据采用深度栈式稀疏自编码(SAE)的模型进行二次特征提取,构造深度学习网络,对浅层复合特征进行高层、深度学习和加工;
步骤4:采用Softmax分类器分类并将分类结果进行显示,该过程即实现了对手写数字的识别。
进一步地,所述主成分分析的实现过程具体如下:
(1)为使原数据A的均方误差最小,向量的均值应为零,即数据应以原点作为中心,因此现将原数据A以平均值为中心移到原点得到数据X:
(2)协方差用于衡量两个变量的总体误差,而方差是两个变量相同的特殊情况下的协方差,计算X的协方差无偏估计矩阵Y:
由于两个变量相同,此Y也是方差无偏估计矩阵,n为手写数字图像的像素个数;
(3)计算协方差矩阵Y的特征值D和单位正交特征向量V,再让特征值D由大到小进行排序;
(4)对应特征值的排序将特征向量排序后,即可得到变换矩阵v,令X乘以变化矩阵v即可得到已排序的投影数据Z,其中,第一个对应的就是第一主成分,第二个对应的就是次主成分,以此类推;
(5)λi是协方差矩阵,也是方差矩阵的第i个主元的特征值;计算第i个主元的方差贡献率:
而R个主元的累计方差贡献率为:
求得累计方差贡献率超过99%的主成分数目R,然后在已排序的投影数据Z中取前R维,并将结果记为矩阵B。
进一步地,所述方向梯度直方图(HOG)技术的实现过程具体如下:
(1)将图像灰度化;
(2)采用Gamma校正法对输入图像进行颜色空间的归一化,调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时抑制噪音的干扰;
(3)将图像划分为单元格(cell),每2x2个像素点组成一个单元格;
(4)计算图像每个像素的梯度,捕获轮廓信息:
Gx(x,y)=H(x+1,y)-H(x-1,y) ⑤
Gy(x,y)=H(x,y+1)-H(x,y-1) ⑥
Gx(x,y),Gy(x,y),H(x,y)分别代表像素点(x,y)处的水平方向梯度,垂直方向梯度,和像素值;像素点(x,y)处的梯度幅值G(x,y)和梯度方向α(x,y)分别为:
梯度方向采用无符号的形式,并将0~180分成9等分;
图像中每个单元格的梯度方向都分成9个方向块,使用单元格中的梯度方向和大小对9个方向进行加权投影,最后,每个单元格产生9维的特征向量;
(5)将每2x2个单元格组成一个块,一个块内所有单元格的特征描述符串联起来后归一化,便得到该块的HOG特征;HOG结构采用矩形HOG结构;
(6)将图像所有块的HOG特征串联起来就可得到图像的HOG特征,并将该HOG特征记为v;
(7)将特征进行归一化,对特征提取后的特征向量进行特征变换,
v←v/255 ⑨
其中,ε=10-8,上标T向量的转置;
经过多特征融合后构造浅层复合特征数据。
进一步地,步骤3具体是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710093707.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像降噪方法及终端
- 下一篇:一种人脸识别样本丰富化的方法