[发明专利]手写数字识别方法及装置在审
申请号: | 201710291518.9 | 申请日: | 2017-04-28 |
公开(公告)号: | CN108805221A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 李书霞 | 申请(专利权)人: | 普天信息技术有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 衣淑凤;宋志强 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写数字识别 神经网络 训练样本 适应度 神经网络模型 手写数字 算法 神经网络训练 准确度 结束条件 起始模型 算法更新 随机产生 拓扑结构 依次选择 权值和 申请 返回 | ||
1.一种手写数字识别方法,其特征在于,该方法包括:
A、确定神经网络的拓扑结构;获取神经网络的手写数字训练样本;设定灰狼优化GWO算法的狼群规模N;根据设定的GWO算法的狼群规模N,随机产生N匹狼,其中,每匹狼的位置对应神经网络模型的一组权值和阈值;
B、对于每匹狼,从所述手写数字训练样本中依次选择训练样本,对该匹狼当前对应的神经网络模型采用选择的训练样本进行训练;当每匹狼对应的本轮神经网络训练结束时,计算本轮神经网络训练每匹狼对应的适应度;当计算得到所有狼的适应度后,选择适应度最高的三匹狼,根据该三匹狼的位置信息采用GWO算法更新其它狼的位置信息;
C、判断是否满足GWO算法的结束条件,若是,将当前适应度最高的狼对应的神经网络模型作为最优神经网络起始模型,在该最优神经网络起始模型的基础上采用手写数字训练样本进行训练,将训练得到的神经网络模型作为最终使用的用于识别手写数字的神经网络模型;否则,返回步骤B。
2.根据权利要求1所述的方法,其特征在于,所述计算本轮神经网络训练每匹狼对应的适应度为:
对于每匹狼,将验证样本集中的验证样本依次输入对该匹狼当前神经网络训练结束得到的神经网络模型中,根据神经网络的输出采用下述公式得到本轮神经网络训练该匹狼对应的模型损失值loos(t):
其中,y为神经网络神经元的期望输出值,z为神经网络神经元的实际输出值,K是验证样本集的大小,Xk表示第k个验证样本,t表示GWO算法的迭代次数,t为大于0的整数;
且,一匹狼对应的模型损失值越小,表示该匹狼对应的适应度越高。
3.根据权利要求1所述的方法,其特征在于,所述根据该三匹狼的位置信息采用GWO算法更新其它狼的位置信息包括:
计算:
其中,α、β、δ代表适应度最高的三匹狼,是α狼的当前位置信息,是β狼的当前位置信息,是δ狼的当前位置信息,是其它狼中的任一匹狼ω的当前位置信息,t为GWO算法的迭代次数,t为大于0的整数;
计算:
其中,为优化后的ω狼的位置信息,是系数向量,和m=1、2、3的表达式如下所示:
其中,系数随着GWO算法迭代次数t的增加从2到0线性递减,和是[0,1]内的随机向量。
4.根据权利要求1所述的方法,其特征在于,所述GWO算法的结束条件为:
GWO算法的迭代次数达到设定的最大迭代次数,或/和适应度最高的α狼的适应度达到预设适应度阈值。
5.根据权利要求1所述的方法,其特征在于,所述每匹狼的位置信息的维度Dim为:
其中,lth是神经网络第th层内的神经元个数,Th为神经网络的总层数。
6.根据权利要求1所述的方法,其特征在于,所述将当前适应度最高的狼对应的神经网络模型作为最优神经网络起始模型进一步包括:
根据如下公式确定当前适应度最高的α狼的位置信息与最优神经网络起始模型中的权值和阈值的对应关系:
其中:
Wi是神经网络的第i层与第i+1层之间的权值,Bi是神经网络的第i层与第i+1层之间的阈值,是α狼的位置信息,li是神经网络的第i层神经元的个数。
7.根据权利要求1至6任一所述的方法,其特征在于,所述神经网络为BP神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710291518.9/1.html,转载请声明来源钻瓜专利网。