[发明专利]模型压缩方法、模型压缩系统、服务器及存储介质在审
申请号: | 202111266014.4 | 申请日: | 2021-10-28 |
公开(公告)号: | CN114004334A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 刘利源;杨玺坤;骆庆开;王永成;韩炳涛;屠要峰 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 压缩 方法 系统 服务器 存储 介质 | ||
1.一种模型压缩方法,其特征在于,包括:
接收候选模型;
对所述候选模型进行神经网络架构搜索,得到多个变换模型;
对所述候选模型进行算力压缩得到压缩模型;
将所述变换模型、所述压缩模型作为所述候选模型,重新进行所述神经网络架构搜索和所述算力压缩。
2.根据权利要求1所述的模型压缩方法,其特征在于,所述对所述候选模型进行算力压缩得到压缩模型,包括:
计算出所述候选模型中各个层的算力;
比较各个所述层的算力,得到算力最大层;
对所述算力最大层进行算力压缩,得到所述压缩模型。
3.根据权利要求2所述的模型压缩方法,其特征在于,所述对所述算力最大层进行算力压缩,包括:
减小所述算力最大层的参数量,或者,移除所述算力最大层,或者,减小所述算力最大层的输入特征图大小。
4.根据权利要求1所述的模型压缩方法,其特征在于,所述对所述候选模型进行神经网络架构搜索,得到多个变换模型,包括:
基于预设的搜索空间进行所述神经网络架构搜索,对所述候选模型进行随机变换,得到多个变换模型。
5.根据权利要求1所述的模型压缩方法,其特征在于,所述接收候选模型之后,还包括:
对所述候选模型进行训练得到训练后模型;
获取所述训练后模型的准确度以及算力;
基于所述准确度、所述算力得到所述训练后模型对应的所述候选模型的评估参数。
6.根据权利要求5所述的模型压缩方法,其特征在于,所述评估参数包括评估分数;所述基于所述准确度、所述算力得到所述训练后模型对应的所述候选模型的评估参数之后,还包括:
保留所述评估分数大于或等于预设分数的所述候选模型,或者,保留所述评估分数最大的N个所述候选模型。
7.根据权利要求5所述的模型压缩方法,其特征在于,所述接收候选模型的步骤至所述将所述变换模型、所述压缩模型作为所述候选模型的步骤为一次轮询;所述评估参数包括评估分数;所述基于所述准确度、所述算力得到所述训练后模型对应的所述候选模型的评估参数之后,还包括:
判断本次轮询得到的最大评估分数是否大于上一次轮询得到的最大评估分数;
若是,则进入所述神经网络架构搜索以及所述算力压缩的步骤;
若否,则将计数器数值加1,判断所述计数器数值是否小于预设阈值;所述计数器数值的初始数值为0;
若所计数器数值小于所述预设阈值,则进入所述神经网络架构搜索以及所述算力压缩的步骤;若所述计数器数值大于或等于所述预设阈值,则轮询结束。
8.根据权利要求7所述的模型压缩方法,其特征在于,在轮询结束的情况下,在多个所述候选模型中获取所述目标候选模型;所述目标候选模型的准确度大于预设准确度且所述目标候选模型的算力小于预设算力。
9.根据权利要求1所述的模型压缩方法,其特征在于,第一次轮询接收的所述候选模型为用户输入的基准模型。
10.一种模型压缩系统,其特征在于,包括:接收模块、模型自动搜索模块、算力压缩模块、选取模块;
所述接收模块用于接收候选模型;
所述模型自动搜索模块用于对所述候选模型进行神经网络架构搜索,得到多个变换模型并作为所述候选模型输入所述接收模块;
所述算力压缩模块用于对所述候选模型进行算力压缩得到压缩模型,所述压缩模型作为所述候选模型输入所述接收模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111266014.4/1.html,转载请声明来源钻瓜专利网。