[发明专利]基于深度学习优化器的大规模图像分类方法在审
申请号: | 202210814527.2 | 申请日: | 2022-07-12 |
公开(公告)号: | CN115170879A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 林宙辰;谢星宇 | 申请(专利权)人: | 北京大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 优化 大规模 图像 分类 方法 | ||
1.一种基于深度学习优化器的大规模图像分类方法,其特征是,构建新的深度学习优化器,利用图像训练数据和构建的深度学习优化器训练深度神经网络模型,得到训练好的图像分类深度神经网络模型;再将待分类的包含预定义类别的彩色图像输入到训练好的图像分类深度神经网络模型,模型的输出为图像的类别标签,由此实现大规模图像分类;包括如下步骤:
1)进行图像预处理,分别得到训练图像数据和待分类图像数据;
2)构建新的深度学习优化器,深度学习优化器的输入是单张彩色图像或批量彩色图像,输出为图像的类别标签;构建深度学习优化器包括如下过程:
21)对Nesterov加速算法进行改进,设计基于Nesterov加速算法改进的动量估计方法,表示为式1:
其中,k为迭代次数;gk和gk-1是第k次和第k-1次迭代的随机的梯度估计;ξk是均值为0的随机噪声;mk是第k次迭代的一阶动量;η>0是基础学习率;β1是一阶动量的累积系数,取值为区间0-1;θ是可学习的网络参数;θk表示第k次迭代的网络参数;
22)通过新的动量估计方法与深度优化器中的自适应梯度方法,构建得到新的深度学习优化器;
将式1的改进动量估计方法用于深度学习优化器中的自适应梯度更新方法中的一阶动量与二阶动量,并为梯度差分项引入单独的累积系数β2,进一步建立深度学习优化器,表示为式3:
其中,mk,nk分别为第k次迭代的一阶动量和二阶动量;vk为第k次迭代的彩色图像的随机梯度差分动量;ηk是第k次迭代的广义学习率;最后一行的公式用于参数更新;向量的平方为按维度分别平方;是Hadamard内积;ε>0是光滑参数;β1,β2和β3分别是一阶动量、梯度差分动量和二阶动量的累积系数,取值为区间0-1;
3)利用训练图像数据和构建的深度学习优化器,训练深度神经网络模型,得到训练好的图像分类深度神经网络模型;将训练图像数据输入深度学习优化器,输出为图像的类别标签;
设置随机深度机制对深度神经网络模型进行训练;训练损失函数设置为交叉熵损失函数;在训练过程中采用余弦学习率衰减法衰减广义学习率的大小;
4)将待分类的包含预定义类别的彩色图像输入到训练好的图像分类深度神经网络模型,即可输出图像的类别标签;
通过上述步骤,实现基于深度学习优化器的大规模图像分类。
2.如权利要求1所述基于深度学习优化器的大规模图像分类方法,其特征是,在步骤22)建立的深度学习优化器之后,进一步地,通过引入权重衰减技术,得到带权重衰减的深度学习优化器;具体是:
对步骤22)建立得到的深度学习优化器引入权重衰减策略,得出带权重衰减的参数更新公式,表示为式6:
得到带权重衰减的Adan优化器,表示为式7:
其中,λ为权重衰减的系数。
3.如权利要求1所述基于深度学习优化器的大规模图像分类方法,其特征是,利用训练图像数据,并使用构建的深度学习优化器或带权重衰减的深度学习优化器训练给定的深度神经网络模型,得到训练好的图像分类深度神经网络模型;深度神经网络模型可包括ResNet-50网络模型和ResNet-101网络模型。
4.如权利要求3所述基于深度学习优化器的大规模图像分类方法,其特征是,采用带权重衰减的Adan进行训练时,选取权重衰减的系数为λ=0.02,基本学习率η=1.5e-2;并在训练的过程中采用余弦学习率衰减法去衰减η的大小。
5.如权利要求3所述基于深度学习优化器的大规模图像分类方法,其特征是,模型训练的数量批大小为4096;热启动轮数设置为60。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210814527.2/1.html,转载请声明来源钻瓜专利网。