[发明专利]一种用于二值卷积神经网络的非零填补训练方法在审

专利信息
申请号: 202010455024.1 申请日: 2020-05-26
公开(公告)号: CN111639751A 公开(公告)日: 2020-09-08
发明(设计)人: 丁文锐;李越;刘春蕾 申请(专利权)人: 北京航空航天大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 北京永创新实专利事务所 11121 代理人: 周长琪
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 卷积 神经网络 填补 训练 方法
【权利要求书】:

1.一种用于二值卷积神经网络的非零填补训练方法,其特征在于:具体包括如下步骤:

步骤一:准备应用于视觉任务的训练数据集;

步骤二:构建用于视觉任务的深度卷积神经网络,将网络中的权重与激活均二值化为1bit数值,并以预训练的填补为0的零填补二值网络权重对其进行初始化;

步骤三:利用知识蒸馏理论构建用于非零填补二值网络的联合损失函数;

步骤四:在训练数据集上对非零填补二值网络进行逐渐增加填补为1的通道数渐进式训练;

步骤五:将步骤四得到的完全非零填补二值网络络用于任务的测试集,测试其分类效果。

2.如权利要求1所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤2中构建二值卷积神经网络的具体方法为:

首先以三元组的形式定义一个L层卷积的全精度CNN结构:I,W,Conv;其中I与W为张量集合;令Il代表第l层的输入特征图;Wl表示第l层的卷积核;则操作符Conv表示输入特征图Il与同层所有卷积核Wl之间的卷积操作;

构建二值卷积神经网络,需利用符号函数对全精度特征图与卷积核进行二值化操作,具体表述为:

其中,与表示二值化后的特征图与卷积核,对于任意输入a,符号函数sign(·)的表达式为:

进行卷积操作时,由于一些网络结构上的需要,需对进行填补操作,以下式描述:

其中,即为填补数值value后的特征图。

3.如权利要求1所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤2中,以预训练的填补为0的零填补二值网络权重初始化所构建的二值卷积神经网络权重。

4.如权利要求1所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤2中,用于非零填补二值网络的联合损失函数的具体方法为:

将填补为0的预训练二值网络作为教师网络,将填补为1的待训练二值网络作为学生网络,将输入图像分别输入两个网络,教师网络的输出作为软目标,计算与学生网络输出的交叉熵损失,具体计算公式为:

其中,xi为第i个训练样本中的图像数据,Ws为学生网络的权重参数,Lst(xi;Ws)为学生网络与教师网络输出之间的交叉熵损失,n为分类任务的类别总数,Sj与Tj分别对应于学生网络与教师网络的第j个输出,其中学生网络的总输出S的计算公式为S=Fs(x;Ws),即将输入图像输入到参数为Ws的学生网络Fs中所产生的输出;教师网络的总输出T的计算公式为T=Ft(x;Wt),即将输入图片输入到参数为Wt的教师网络Ft中所产生的输出,称之为软目标;

对于网络训练过程中的联合损失函数,其具体计算公式为:

L(x;Ws)=Ls(x;Ws)+θLst(x;Ws)

等式左侧即为本方法改进后的联合损失函数,等式右侧中Ls(x;Ws)为学生网络与硬目标的交叉损失,θ为蒸馏损失的加权系数。

5.如权利要求4所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:设计θ数值为0.25。

6.如权利要求4所述一种用于二值卷积神经网络的非零填补训练方法,其特征在于:步骤4中,渐进式训练方法为:

以c表示训练过程中填补为1的特征图通道比例,epoch为当前训练过程对于数据集的迭代次数,训练时c将随着epoch的增加而逐渐增大,其函数可具体描述为:

c=tanh(epoch/50)

其中对于任意输入a,tanh函数产生的输出可表示为:

在某一特定迭代次数下,二值网络填补为1的特征图通道数表示为:

cnum=[c1×c]

c1为特征图的总通道数,[·]为取整操作。当迭代次数为0即初始时刻时,cnum=0,表示该网络实际上为零填补二值网络,随着迭代数增大,cnum逐渐增大,网络逐渐向非零填补二值网络演化,最终演变为完全非零填补二值网络。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010455024.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top