[发明专利]一种利用分块循环矩阵的神经网络压缩方法在审
申请号: | 201911084979.4 | 申请日: | 2019-11-08 |
公开(公告)号: | CN111047038A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 杨宇钢;胡凌燕 | 申请(专利权)人: | 南昌大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 南昌金轩知识产权代理有限公司 36129 | 代理人: | 钟隆辉 |
地址: | 330000 江西省*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 分块 循环 矩阵 神经网络 压缩 方法 | ||
1.一种利用分块循环矩阵的神经网络压缩方法,其特征在于:包括以下步骤:
步骤1:通过读取神经网络中最长基础随机符号向量,在神经网络的每层截取该层所需长度的基础符号向量,扩展该层的基础符号向量至输入向量维度,根据符号向量的位置对输入向量做符号翻转,使符号向量与输入向量元素相乘得到新的输入向量;
步骤2:训练构成的新的块循环网络,存储最长基础随机符号向量和神经网络模型参数;
步骤3:根据输入特征图的稀疏度和信息丰富度,决定输入特征图的重要性。根据特征图的重要性去减少特征图上进行卷积的卷积核个数,对网络结构进行精简;
步骤4:采用细粒度算法对神经网络模型进行剪枝。
2.根据权利要求1所述的一种利用分块循环矩阵的神经网络压缩方法,其特征在于:
步骤1中所述的最长基础随机符号向量根据所有层输入特征向量的维度和分块大小确定。
3.根据权利要求1所述的一种利用分块循环矩阵的神经网络压缩方法,其特征在于:
步骤1中所述的符号向量生成步骤如下:
A:生成长度为n_sign的基础随机符号向量,其中n_sign的取值范围为区间[blocksize,n_x]。其中,基础随机符号向量的生成可以有多种方式:比如随机变量生成服从二项分布;
B:根据基础随机符号向量扩展出最后的随机符号向量。计算扩展操作次数block_sign=n_x/n_sign+1;将基础随机符号向量按一定规则生成新的符号向量,重复block_sign次,得到n_x维符号向量:
其中:n_sign为符号向量的长度;
n_x为输入向量的维度:
n_sign为符号的数目:
block size代表块大小:
block_sign代表每一个块所对应的符号的指数。
4.根据权利要求1所述的一种利用分块循环矩阵的神经网络压缩方法,其特征在于:
步骤1中所述的扩展满足:按块大小划分扩展后的符号向量,相邻两个块的符号向量不可相同。
5.根据权利要求1所述的一种利用分块循环矩阵的神经网络压缩方法,其特征在于:
步骤4中所述的细粒度算法流程如下:
a:计算每个特征图对应卷积核的稀疏度;
b:计算每个特征图对应卷积核的密度熵;
c:计算每个特征图的重要性分数;
d:计算每个特征图需要的卷积核个数:
e:使用K-均值算法对每个特征图对应的卷积核进行聚类,得到聚类中心和索引值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌大学,未经南昌大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911084979.4/1.html,转载请声明来源钻瓜专利网。