[发明专利]神经网络剪枝方法、装置、电子设备及计算机可读介质在审
申请号: | 201811538782.9 | 申请日: | 2018-12-10 |
公开(公告)号: | CN111291884A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 剪枝 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种神经网络剪枝方法,其特征在于,包括:
获取第一输入数据;其中,所述第一输入数据包括第一权值数据;
将所述第一权值数据调整为第二权值数据;
根据第二输入数据执行神经网络计算,其中,所述第二输入数据包括所述第二权值数据以及输入神经元数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一权值数据调整为第二权值数据,包括:
对所述第一权值数据进行分组,得到M组权值;其中,M为大于0的正整数;
根据预设的稀疏度P确定所述M组权值中至少一组权值的阈值;
根据确定好的所述阈值对所述M组权值中的至少一组权值进行剪枝,得到第二权值数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一权值数据调整为第二权值数据,包括:
对所述第一权值数据进行分组,得到M组权值;其中,M为大于0的正整数;
根据预设的稀疏度P确定所述M组权值中每组权值的阈值;
根据确定好的所述阈值对所述M组权值中的每组权值进行剪枝,得到第二权值数据。
4.根据权利要求3所述的方法,其特征在于,所述神经网络为全连接层神经网络;
所述根据预设的稀疏度P确定所述M组权值中每组权值的阈值,包括:
确定所述M组权值中的第i组权值中第Q个权值为每组权值的阈值,其中,Nin为输入神经元的个数,Nout为输出神经元的个数,所述第i组中的权值按绝对值从小到大顺序排列,所述i为小于等于M的正整数。
5.根据权利要求4所述的方法,其特征在于,所述Q为经过取整计算得到的。
6.根据权利要求3所述的方法,其特征在于,所述神经网络为卷积层神经网络;
所述根据预设的稀疏度P确定所述M组权值中每组权值的阈值,包括:
确定所述M组权值中的第i组权值中第R个权值为每组权值的阈值,其中,Nfin为输入特征图像的数量,Nfout为输出特征图像的数量,Kx以及Ky为卷积层神经网络中卷积核的大小,所述第i组中的权值按绝对值从小到大顺序排列,所述i为小于等于M的正整数。
7.根据权利要求3所述的方法,其特征在于,所述神经网络为LSTM层神经网络;所述LSTM层神经网络包括N个全连接层,所述N为大于0的正整数;
所述根据预设的稀疏度P确定所述M组权值中每组权值的阈值,包括:
确定第j个全连接层的第i组权值中第S个权值为每组权值的阈值,其中,Nin_j为第j个全连接层输入神经元的个数,Nout_j为第j个全连接层输出神经元的个数,所述第i组中的权值按绝对值从小到大顺序排列,所述i为小于等于M的正整数,所述j为小于等于N的正整数。
8.根据权利要求3所述的方法,其特征在于,所述根据确定好的所述阈值对所述M组权值中的每组权值进行剪枝,得到第二权值数据,包括:
对第i组(i=0,1,……,M)权值中小于所述确定好的阈值的权值进行剪枝,得到所述第二权值数据。
9.一种神经网络剪枝装置,其特征在于,包括:
获取单元,用于获取第一输入数据;其中,所述第一输入数据包括第一权值数据;
负载均衡单元,用于将所述第一权值数据调整为第二权值数据;
计算单元,用于根据第二输入数据执行神经网络计算,其中,所述第二输入数据包括第二权值数据以及输入神经元数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811538782.9/1.html,转载请声明来源钻瓜专利网。