[发明专利]一种用于二值卷积神经网络的非零填补训练方法在审
申请号: | 202010455024.1 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111639751A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 丁文锐;李越;刘春蕾 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 周长琪 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 卷积 神经网络 填补 训练 方法 | ||
1.一种用于二值卷积神经网络的非零填补训练方法,其特征在于:具体包括如下步骤:
步骤一:准备应用于视觉任务的训练数据集;
步骤二:构建用于视觉任务的深度卷积神经网络,将网络中的权重与激活均二值化为1bit数值,并以预训练的填补为0的零填补二值网络权重对其进行初始化;
步骤三:利用知识蒸馏理论构建用于非零填补二值网络的联合损失函数;
步骤四:在训练数据集上对非零填补二值网络进行逐渐增加填补为1的通道数渐进式训练;
步骤五:将步骤四得到的完全非零填补二值网络络用于任务的测试集,测试其分类效果。
2.如权利要求1所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤2中构建二值卷积神经网络的具体方法为:
首先以三元组的形式定义一个L层卷积的全精度CNN结构:I,W,Conv;其中I与W为张量集合;令Il代表第l层的输入特征图;Wl表示第l层的卷积核;则操作符Conv表示输入特征图Il与同层所有卷积核Wl之间的卷积操作;
构建二值卷积神经网络,需利用符号函数对全精度特征图与卷积核进行二值化操作,具体表述为:
其中,与表示二值化后的特征图与卷积核,对于任意输入a,符号函数sign(·)的表达式为:
进行卷积操作时,由于一些网络结构上的需要,需对进行填补操作,以下式描述:
其中,即为填补数值value后的特征图。
3.如权利要求1所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤2中,以预训练的填补为0的零填补二值网络权重初始化所构建的二值卷积神经网络权重。
4.如权利要求1所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤2中,用于非零填补二值网络的联合损失函数的具体方法为:
将填补为0的预训练二值网络作为教师网络,将填补为1的待训练二值网络作为学生网络,将输入图像分别输入两个网络,教师网络的输出作为软目标,计算与学生网络输出的交叉熵损失,具体计算公式为:
其中,xi为第i个训练样本中的图像数据,Ws为学生网络的权重参数,Lst(xi;Ws)为学生网络与教师网络输出之间的交叉熵损失,n为分类任务的类别总数,Sj与Tj分别对应于学生网络与教师网络的第j个输出,其中学生网络的总输出S的计算公式为S=Fs(x;Ws),即将输入图像输入到参数为Ws的学生网络Fs中所产生的输出;教师网络的总输出T的计算公式为T=Ft(x;Wt),即将输入图片输入到参数为Wt的教师网络Ft中所产生的输出,称之为软目标;
对于网络训练过程中的联合损失函数,其具体计算公式为:
L(x;Ws)=Ls(x;Ws)+θLst(x;Ws)
等式左侧即为本方法改进后的联合损失函数,等式右侧中Ls(x;Ws)为学生网络与硬目标的交叉损失,θ为蒸馏损失的加权系数。
5.如权利要求4所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:设计θ数值为0.25。
6.如权利要求4所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤4中,渐进式训练方法为:
以c表示训练过程中填补为1的特征图通道比例,epoch为当前训练过程对于数据集的迭代次数,训练时c将随着epoch的增加而逐渐增大,其函数可具体描述为:
c=tanh(epoch/50)
其中对于任意输入a,tanh函数产生的输出可表示为:
在某一特定迭代次数下,二值网络填补为1的特征图通道数表示为:
cnum=[c1×c]
c1为特征图的总通道数,[·]为取整操作。当迭代次数为0即初始时刻时,cnum=0,表示该网络实际上为零填补二值网络,随着迭代数增大,cnum逐渐增大,网络逐渐向非零填补二值网络演化,最终演变为完全非零填补二值网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010455024.1/1.html,转载请声明来源钻瓜专利网。