[发明专利]一种卷积神经网络训练方法、图像识别方法和装置在审

申请号：	202010529092.8	申请日：	2020-06-11
公开（公告）号：	CN111680795A	公开（公告）日：	2020-09-18
发明（设计）人：	王世安	申请（专利权）人：	广州工程技术职业学院
主分类号：	G06N3/08	分类号：	G06N3/08;G06N3/04
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	沈闯
地址：	510000 ***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种卷积神经网络训练方法图像识别装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种卷积神经网络训练方法，其特征在于，包括：

获取待训练的卷积神经网络；

将测度损失和软最大损失结合，构建所述卷积神经网络训练时的类信息和节点结构的学习损失函数，其中，所述学习损失函数为：

L＝βL_metric+(λ-β)L_softmax；

式中，L为学习损失函数，β为损失的重量，L_metric为测度损失，λ为软最大损失和测度损失的重量之和，L_softmax为软最大损失；

基于反向传播算法和随机梯度下降法，通过所述学习损失函数对所述卷积神经网络进行训练。

2.根据权利要求1所述的卷积神经网络训练方法，其特征在于，所述卷积神经网络包括：两个第一卷积单元、三个第二卷积单元和两个完全连接单元；

所述第一卷积单元包括：卷积层、池化层、激活层、退出层和规范化层和卷积脱落层；

所述第二卷积单元包括：卷积层、激活层、退出层和规范化层和卷积脱落层。

3.根据权利要求2所述的卷积神经网络训练方法，其特征在于，所述测度损失的计算过程包括：

获取训练阶段时，由第一完全连接单元的第一输出构成的第一输出集合，所述第一输出集合为：其中，x_i为第i个第一输出，N为第一输出集合中第一输出的个数；

获取类信息的对应图像构成的对应图像集合，所述对应图像集合为其中，y_i'为第i'个对应图像，N'为对应图像集合中的对应图像个数；

根据所述第一输出和所述对应图像，构建所述测度损失对应的损失函数；

其中，所述测度损失对应的损失函数为：

式中，p为对应图像的编号，s_i,j∈{0,1}，当y_i'＝y_j'时s_i,j＝1，否则s_i,j＝0，α为内斯特罗夫动量，d_Wi,j为x_i和x_j之间的平方距离，d_Wi,j＝(x_i-x_j)^TW(x_i-x_j)，W为参数矩阵。

4.根据权利要求1所述的卷积神经网络训练方法，其特征在于，所述软最大损失L_softmax是λ为1且β为0的测度损失值。

5.一种图像识别方法，其特征在于，包括：

获取待识别图像和用于识别所述待识别图像的卷积神经网络模型，其中所述卷积神经网络模型通过权利要求1至4中任一项所述的卷积神经网络训练方法训练得到；

通过所述卷积神经网络模型对所述待识别图像进行识别。

6.一种卷积神经网络训练装置，其特征在于，包括：

获取单元，用于获取待训练的卷积神经网络；

函数构建单元，用于将测度损失和软最大损失结合，构建所述卷积神经网络训练时的类信息和节点结构的学习损失函数，其中，所述学习损失函数为：

L＝βL_metric+(λ-β)L_softmax；

式中，L为学习损失函数，β为损失的重量，L_metric为测度损失，λ为软最大损失和测度损失的重量之和，L_softmax为软最大损失；

训练单元，用于基于反向传播算法和随机梯度下降法，通过所述学习损失函数对所述卷积神经网络进行训练。

7.根据权利要求6所述的卷积神经网络训练装置，其特征在于，所述卷积神经网络包括：两个第一卷积单元、三个第二卷积单元和两个完全连接单元；

所述第一卷积单元包括：卷积层、池化层、激活层、退出层和规范化层和卷积脱落层；

所述第二卷积单元包括：卷积层、激活层、退出层和规范化层和卷积脱落层。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州工程技术职业学院，未经广州工程技术职业学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010529092.8/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载