[发明专利]一种深度卷积神经网络快速自动压缩方法在审

申请号：	202010659862.0	申请日：	2020-07-09
公开（公告）号：	CN111860779A	公开（公告）日：	2020-10-30
发明（设计）人：	唐文婷;韦星星;王越;李波	申请（专利权）人：	北京航空航天大学
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/063;G06N3/08
代理公司：	北京慕达星云知识产权代理事务所(特殊普通合伙) 11465	代理人：	曹鹏飞
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种深度卷积神经网络快速自动压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种深度卷积神经网络快速自动压缩方法，其特征在于，包括输入优化目标和待优化模型，并根据所述待优化模型和所述优化目标初始化强化学习代理和环境，进行最优模型量化方案搜索，具体搜索过程如下：

S1单轮搜索过程：

S11：根据通道重要性计算零比特通道索引和通道最小比特数；

S12：根据所述零比特通道索引确定当前模型量化方案；

S13：基于所述当前模型量化方案计算量化后模型大小；

S14：若当前可压缩层是最后一层且所述当前模型量化方案不满足所述优化目标，则根据所述通道最小比特数循环调整所述当前模型量化方案，直至满足所述优化目标或不能进行量化为止；

若当前可压缩层不是最后一层，或者所述当前模型量化方案满足所述优化目标，则基于所述量化后模型大小评估当前层量化方案并保存相关环境参数；

S15：继续搜索条件，判断是否结束本轮搜索，并且基于当前层量化方案评估结果进一步判断是否结束本轮搜索以及是否更新最优模型量化方案；

S2多轮搜索过程：重复执行S1，直至当前搜索轮数达到要求搜索轮数后，模型量化方案搜索结束，输出最优压缩模型。

2.根据权利要求1所述的一种深度卷积神经网络快速自动压缩方法，其特征在于，所述待优化模型包括可量化层集合N＝{L₁，...，L_i，...，L_n}，其中i＝1…n，n表示可量化层数，可量化层输入通道数集合I＝{I₁，...，I_n}和可量化层所需存储空间集合LS＝{LS₁，...，LS_n}；

所述优化目标包括压缩后模型最大比特率bit_max、搜索轮数episodes、模型大小压缩比sc∈(0，1]、待优化模型初始化TOP-5准确率acc(N)、最优评估结果R_best和最优模型量化方案P_best；

初始化强化学习环境时，强化学习状态s_i定义为(idx，t，out，in，w，h，stride，k，reducedFLOPs，resFLOPs，reducedSize，restSize，a_i-1)，其中，idx为层索引，t为层类型、包括卷积层和全连接层，out为输出通道数，in为输入通道数，w和h是输入特征向量的宽和高，stride与k为卷积层卷积操作的步长和卷积核的边长、全连接层中stride与k均为1，reducedFLOPs是当前压缩策略减少的计算量、初始化为0，restFLOPs是模型剩余计算量、初始化为模型计算量N_FLOPs，reducedSize是当前压缩策略减少的模型大小、初始化为0，restSize是模型剩余大小、初始化为模型大小N_size，a_i-1为前一个可压缩层稀疏度，初始化为0；

强化学习代理包括行动者网络θ、评价者网络μ和环境噪声σ。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010659862.0/1.html，转载请声明来源钻瓜专利网。

上一篇：双层与单层矿山法隧道之间的转换结构及其施工方法
下一篇：机械冷源与湖水冷源耦合供冷系统及控制方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度卷积神经网络快速自动压缩方法在审

专利文献下载