[发明专利]可在线切换比特位宽的量化神经网络的方法及系统在审
申请号: | 202010929604.X | 申请日: | 2020-09-07 |
公开(公告)号: | CN112101524A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 张娅;杜昆原;王延峰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 切换 比特 量化 神经网络 方法 系统 | ||
1.一种可在线切换比特位宽的量化神经网络的方法,其特征在于,包括:
步骤M1:将不同比特位宽的深度神经网络整合到一个超网络中,所有比特位宽的网络共享同一个网络架构;
步骤M2:超网络以不同的比特位宽运行,对于任意一个比特位宽,得到对应的网络中间层特征,每一个网络中间层特征采用相应的批归一化层进行处理;
步骤M3:通过监督学习对超网络进行训练,在超网络训练阶段模拟量化噪声,直至低比特模式与高比特模式之间的一致性损失函数收敛,得到训练后的超网络;
步骤M4:使用预设的量化器从训练后的超网络中抽取出目标比特位的量化神经网络进行低比特推理;
所述低比特模式是k小于预设值时的比特位宽的子神经网络模式;
所述高比特模式是k为预设值时的比特位宽的子神经网络模式。
2.根据权利要求1所述的可在线切换比特位宽的量化神经网络的方法,其特征在于,所述步骤M1包括:基于高比特神经网络能够量化为低比特神经网络,将不同比特位宽的子神经网络整合到一个超网络中;超网络与不同比特位宽的各子神经网络拥有相同的网络拓扑结构,同时共享所有的卷积层/全连接层参数;低比特位宽的子神经网络能够通过高比特位宽的子神经网络量化得到。
3.根据权利要求1所述的可在线切换比特位宽的量化神经网络的方法,其特征在于,所述步骤M2中每一个网络中间层特征采用相应的批归一化层进行处理包括:
其中,k表示比特位宽;fk表示待处理的k比特位宽子神经网络产生的原始特征;γk和βk表示k比特位宽子神经网络专属的可学习的参数;μk和σk2是原始特征fk的均值和方差;∈表示一个极小量。
4.根据权利要求1所述的可在线切换比特位宽的量化神经网络的方法,其特征在于,所述步骤M3包括:
超网络的优化任务是基于多任务学习,优化的超网络整体目标函数,公式如下:
Lall=∑k∈mode listαkLk+ω||Q||2 (2)
其中,mode list表示超网络包含的所有比特位宽的子神经网络的集合,k表示k比特位宽的子神经网络;Lk表示k比特位宽的子神经网络对应的一致性损失函数;αk表示子优化目标Lk在整体目标函数中占的比重;Q表示超网络的参数;||||2表示L2范数;||Q||2表示参数衰减,对超网络进行正则化;ω为参数衰减的权重;
对于各子优化目标Lk,当k=a时,a表示与硬件相匹配的数据类型,超网络以单精度浮点数运行,La的具体表达形式如下:
其中,(X,Y)表示目标数据集的图像和标签;xi表示图像,yi表示图像类别标签;fa表示单精度浮点数子神经网络;H表示交叉熵函数;
对于各子优化目标Lk,当k<a时,超网络以k比特整型数运行,Lk的表达形式如下:
其中,KL表示低比特模式对应的分布与高比特模式对应的分布之间的KL散度;σ表示softmax函数,将网络的输出映射为概率值;T表示计算概率值的超参数,实现不同比特位宽的子神经网络之间的一致性对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010929604.X/1.html,转载请声明来源钻瓜专利网。