[发明专利]一种卷积神经网络训练方法、图像识别方法和装置在审
申请号: | 202010529092.8 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111680795A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 王世安 | 申请(专利权)人: | 广州工程技术职业学院 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 沈闯 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 卷积 神经网络 训练 方法 图像 识别 装置 | ||
1.一种卷积神经网络训练方法,其特征在于,包括:
获取待训练的卷积神经网络;
将测度损失和软最大损失结合,构建所述卷积神经网络训练时的类信息和节点结构的学习损失函数,其中,所述学习损失函数为:
L=βLmetric+(λ-β)Lsoftmax;
式中,L为学习损失函数,β为损失的重量,Lmetric为测度损失,λ为软最大损失和测度损失的重量之和,Lsoftmax为软最大损失;
基于反向传播算法和随机梯度下降法,通过所述学习损失函数对所述卷积神经网络进行训练。
2.根据权利要求1所述的卷积神经网络训练方法,其特征在于,所述卷积神经网络包括:两个第一卷积单元、三个第二卷积单元和两个完全连接单元;
所述第一卷积单元包括:卷积层、池化层、激活层、退出层和规范化层和卷积脱落层;
所述第二卷积单元包括:卷积层、激活层、退出层和规范化层和卷积脱落层。
3.根据权利要求2所述的卷积神经网络训练方法,其特征在于,所述测度损失的计算过程包括:
获取训练阶段时,由第一完全连接单元的第一输出构成的第一输出集合,所述第一输出集合为:其中,xi为第i个第一输出,N为第一输出集合中第一输出的个数;
获取类信息的对应图像构成的对应图像集合,所述对应图像集合为其中,yi'为第i'个对应图像,N'为对应图像集合中的对应图像个数;
根据所述第一输出和所述对应图像,构建所述测度损失对应的损失函数;
其中,所述测度损失对应的损失函数为:
式中,p为对应图像的编号,si,j∈{0,1},当yi'=yj'时si,j=1,否则si,j=0,α为内斯特罗夫动量,dWi,j为xi和xj之间的平方距离,dWi,j=(xi-xj)TW(xi-xj),W为参数矩阵。
4.根据权利要求1所述的卷积神经网络训练方法,其特征在于,所述软最大损失Lsoftmax是λ为1且β为0的测度损失值。
5.一种图像识别方法,其特征在于,包括:
获取待识别图像和用于识别所述待识别图像的卷积神经网络模型,其中所述卷积神经网络模型通过权利要求1至4中任一项所述的卷积神经网络训练方法训练得到;
通过所述卷积神经网络模型对所述待识别图像进行识别。
6.一种卷积神经网络训练装置,其特征在于,包括:
获取单元,用于获取待训练的卷积神经网络;
函数构建单元,用于将测度损失和软最大损失结合,构建所述卷积神经网络训练时的类信息和节点结构的学习损失函数,其中,所述学习损失函数为:
L=βLmetric+(λ-β)Lsoftmax;
式中,L为学习损失函数,β为损失的重量,Lmetric为测度损失,λ为软最大损失和测度损失的重量之和,Lsoftmax为软最大损失;
训练单元,用于基于反向传播算法和随机梯度下降法,通过所述学习损失函数对所述卷积神经网络进行训练。
7.根据权利要求6所述的卷积神经网络训练装置,其特征在于,所述卷积神经网络包括:两个第一卷积单元、三个第二卷积单元和两个完全连接单元;
所述第一卷积单元包括:卷积层、池化层、激活层、退出层和规范化层和卷积脱落层;
所述第二卷积单元包括:卷积层、激活层、退出层和规范化层和卷积脱落层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州工程技术职业学院,未经广州工程技术职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010529092.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交易验证方法及装置
- 下一篇:一种地形分类方法及装置