[发明专利]神经网络的压缩方法和装置、设备、介质在审
申请号: | 202111311435.4 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114154634A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 洪文静;李皈颖;杨鹏;唐珂 | 申请(专利权)人: | 南方科技大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 洪铭福 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 压缩 方法 装置 设备 介质 | ||
本实施例提供一种神经网络的压缩方法和装置、设备、介质,属于计算机应用技术领域。该方法包括:获取在硬件上运行的预设神经网络;对所述预设神经网络进行压缩处理,以生成至少两个第一压缩神经网络;获取每一所述第一压缩神经网络对应于所述硬件的硬件性能指标;计算所述预设神经网络的第一准确率和每一所述第一压缩神经网络的第二准确率;根据所述硬件性能指标、所述第一准确率、多个所述第二准确率对多个所述第一压缩神经网络进行初步筛选,得到初始神经网络集;根据预设条件对所述初始神经网络集进行二次筛选,得到目标压缩神经网络。根据硬件性能指标和准确率来指导神经网络的压缩,能够实现神经网络在多种硬件上的快速部署。
技术领域
本发明涉及计算机应用技术领域,具体涉及一种神经网络的压缩方法和装置、设备、介质。
背景技术
相关技术中,神经网络压缩方法大多是基于参数数量、压缩率、每秒浮点运算次数或乘积累加运算操作数等代理指标来降低神经网络的延时、内存、功耗等硬件指标。然而,这些代理指标与延时、内存、功耗等硬件指标非单调,而且对硬件不敏感,无法满足深度神经网络应用快速部署的需求。
准确率与硬件性能指标都是神经网络压缩的关键性能,但它们之间是冲突的,且延时和内存等硬件性能指标互相之间也是冲突的,无法达到准确率和硬件性能指标之间的平衡。
发明内容
本申请实施例的主要目的在于提出一种神经网络的压缩方法和装置、设备、介质,能够解决压缩神经网络的硬件性能和准确率之间的冲突。
为实现上述目的,本申请实施例的第一方面提出了一种神经网络的压缩方法,包括:
获取在硬件上运行的预设神经网络;
对所述预设神经网络进行压缩处理,以生成至少两个第一压缩神经网络;
获取每一所述第一压缩神经网络对应于所述硬件的硬件性能指标;
计算所述预设神经网络的第一准确率和每一所述第一压缩神经网络的第二准确率;
根据所述硬件性能指标、所述第一准确率、多个所述第二准确率对多个所述第一压缩神经网络进行初步筛选,得到初始神经网络集;
根据预设条件对所述初始神经网络集进行二次筛选,得到目标压缩神经网络。
在一些实施例,所述根据所述硬件性能指标、所述第一准确率、多个所述第二准确率对所述第一压缩神经网络进行初步筛选,得到初始神经网络集,包括:
根据所述预设神经网络的第一准确率、每一所述第一压缩神经网络的第二准确率和预设的约束参数建立每一所述第一压缩神经网络的准确率约束条件;
若满足所述准确率约束条件的第一压缩神经网络的个数小于预设阈值,则根据每一所述第一压缩神经网络的准确率约束条件和每一所述第一压缩神经网络的第二准确率,对多个所述第一压缩神经网络进行排序,以得到一次排序后的第一压缩神经网络,根据预设的策略对一次排序后的所述第一压缩神经网络进行初步筛选,以得到初始神经网络集;
若满足所述准确率约束条件的第一压缩神经网络的个数大于或等于所述预设阈值,则根据每一所述第一压缩神经网络的硬件性能指标和每一所述第一压缩神经网络的第二准确率,对多个所述第一压缩神经网络进行分组处理,以得到第一分组和第二分组,根据预设的第一选择策略从所述第一分组中获取第一分组压缩网络,并根据预设的第二选择策略从所述第二分组中获取第二分组压缩网络,将第一分组压缩网络和第二分组压缩网络作为初始神经网络集。
在一些实施例,所述根据每一所述第一压缩神经网络的硬件性能指标和每一所述第一压缩神经网络的第二准确率,对多个所述第一压缩神经网络进行分组处理,以得到第一分组和第二分组,包括:
根据每一所述第一压缩神经网络的硬件性能指标和每一所述第一压缩神经网络的第二准确率建立每一所述第一压缩神经网络的目标函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学,未经南方科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111311435.4/2.html,转载请声明来源钻瓜专利网。