[发明专利]一种用于神经网络加速的渐进式块知识蒸馏方法在审
申请号: | 201810758814.X | 申请日: | 2018-07-11 |
公开(公告)号: | CN108921294A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 李玺;赵涵斌;汪慧 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于神经网络加速的渐进式块知识蒸馏方法,方法具体包括以下步骤:输入原复杂网络和相关参数;将原复杂网络分成多个子网络块,按块设计学生子网络块并随机初始化参数;将输入的原复杂网络作为第一次块蒸馏过程的教师网络,块蒸馏过程完成得到一个学生网络,其中第一个学生子网络块参数最优;将上一次块蒸馏过程得到的学生网络作为下一次块蒸馏过程的教师网络,得到下一个学生网络,其中块蒸馏结束的学生子网络块参数最优;所有子网络块蒸馏过程完成,得到最终的简单学生网络以及最优参数。本发明能在一般的硬件架构上能够达到对模型压缩加速的效果,同时实现简单,是一个既有效并且实用简单的深度网络模型压缩加速算法。 | ||
搜索关键词: | 蒸馏过程 网络 复杂网络 蒸馏 神经网络 块参数 学生 随机初始化 加速算法 模型压缩 网络模型 相关参数 硬件架构 最优参数 子网络 按块 教师 压缩 | ||
【主权项】:
1.一种用于神经网络加速的渐进式块知识蒸馏方法,包括以下步骤:S1、输入原复杂网络和相关参数,定义方法目标;S2、将原复杂网络分成多个子网络块,基于学生子网络块设计准则,按块设计学生子网络块并随机初始化其参数;S3、蒸馏第一个子网络块,将S1中输入的原复杂网络作为第一次块蒸馏过程的教师网络,一次块蒸馏过程完成后得到第一个学生网络,其中蒸馏完成的第一个学生子网络块具有最优参数;S4、蒸馏下一个子网络块,将上一次块蒸馏过程得到的学生网络作为本次块蒸馏过程的教师网络,一次块蒸馏过程完成得到下一个学生网络,其中蒸馏完成的下一个学生子网络块具有最优参数;S5、重复步骤S4直到所有子网络块蒸馏过程完成,将最后一次块蒸馏得到的学生网络和最优参数作为最终的简单学生网络以及最终参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810758814.X/,转载请声明来源钻瓜专利网。