[发明专利]一种基于质谱数据集的神经网络模型压缩方法及系统在审
申请号: | 202011333324.9 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112329922A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 王振宇;魏剑;王阳东;陈严;李伟 | 申请(专利权)人: | 北京大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 彭伶俐 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 神经网络 模型 压缩 方法 系统 | ||
本发明实施例公开了一种基于质谱数据集的神经网络模型压缩方法及系统,对待压缩的神经网络模型进行训练,对训练好的神经网络模型进行剪枝,对剪枝后的神经网络模型进行量化,将量化后的神经网络模型的BN层和卷积层合并得到无BN层的神经网络模型,对获得的网络模型再次进行量化得到压缩模型。以大型网络作为输入模型,无关紧要的通道被自动识别和剪枝,卷积层和全连接层参数位数上的冗余被去除,并丢弃BN层,产生精度相当但薄而紧凑(高效)的模型。
技术领域
本发明实施例涉及机器学习技术领域,具体涉及一种基于质谱数据集的神经网络模型压缩方法及系统。
背景技术
自从AlexNet在2012年赢得ImageNet大赛的冠军一来,卷积神经网络在计算机视觉领域变得越来越流行,一个主要趋势就是为了提高准确率就要做更深和更复杂的网络模型,然而这样的模型在规模和速度方面显得捉襟见肘,在许多真实场景,比如机器人、自动驾驶、增强现实等任务中,很难在计算力有限的平台上实时的完成工作,这是大模型的局限性所在。模型压缩是指利用数据集对已经训练好的深度模型进行精简,进而得到一个轻量且准确率相当的网络,压缩后的网络具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在受限的硬件环境中。
发明内容
为此,本发明实施例提供一种基于质谱数据集的神经网络模型压缩方法及系统,以解决现有的深度神经网络模型复杂不够精简、计算和存储开销大的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明实施例的第一方面,提出了一种基于质谱数据集的神经网络模型压缩方法,所述方法包括:
对待压缩的神经网络模型进行训练;
对训练好的神经网络模型进行剪枝;
对剪枝后的神经网络模型进行量化;
将量化后的神经网络模型的BN层和卷积层合并得到无BN层的神经网络模型,对获得的网络模型再次进行量化得到压缩模型。
进一步地,待压缩的神经网络模型包括特征提取部分和全连接层,所述特征提取部分包括多层卷积层,每层卷积层后均连接有一个BN层,每个BN层后均连接有一个ReLU层。
进一步地,采用随机梯度下降法对待压缩的神经网络模型进行训练。
进一步地,对训练好的神经网络模型进行剪枝,具体包括:
使用设定损失函数对神经网络模型进行训练,设定损失函数通过在神经网络的原损失函数上增加一项对神经网络所有BN层的γ参数的L1范数限制,使得γ参数更加稀疏,设定的损失函数的形式如下:
其中,式(1)中第一项是神经网络的原损失函数,第二项中γ是引入的可学习重构参数,它的意义是使得神经网络可以学习恢复出原始网络所要学习的特征分布,λ是两个损失函数之间的权重值,选择g(γ)=|γ|,即γ的L1范数;
训练到一定准确率后基于神经网络所有BN层的γ参数和要剪枝的比例计算γ的阈值,然后将低于该阈值的γ对应的卷积网络里面的卷积层的输出剪掉;
对剪枝完的神经网络进行微调。
进一步地,对剪枝后的神经网络模型进行量化,具体包括:
对神经网络的卷积层和全连接层的参数进行K位量化。
进一步地,将量化后的神经网络模型的BN层和卷积层合并得到无BN层的神经网络模型,对获得的网络模型再次进行量化得到压缩模型,具体包括:
将神经网络中的每个BN层分别折算到其前侧的卷积层并获得新的卷积层参数,然后对新的卷积层参数再次进行K位量化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011333324.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合蛋白及其制备方法和应用
- 下一篇:一种纽莫康定B0的纯化方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置