[发明专利]一种模型裁剪方法及设备在审
申请号: | 202011147814.X | 申请日: | 2020-10-23 |
公开(公告)号: | CN112418393A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 李远辉;王奇刚;舒红乔;邓建林;杨安荣 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 周伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 裁剪 方法 设备 | ||
1.一种模型裁剪方法,其特征在于,所述方法包括:
获得与待裁剪模型对应的计算力权值和参数量权值,所述待裁剪模型包含至少两层裁剪层;其中,所述计算力权值用于表征模型计算力对模型裁剪贡献度的比值,参数量权值用于表征模型参数量对模型裁剪贡献度的比值;
根据计算力权值和参数量权值对每一层裁剪层进行分析,以确定与所述裁剪层对应的裁剪度参数;
基于所述裁剪度参数对所述待裁剪模型进行裁剪处理,获得裁剪模型。
2.根据权利要求1所述的方法,其特征在于,根据计算力权值和参数量权值对每一层裁剪层进行分析,以确定与裁剪层对应的裁剪度参数,包括:
确定与所述待裁剪模型对应的参数量和计算力;
对所述参数量和计算力进行归一化处理,获得参数比重和计算比重;
通过计算力权值对参数比重进行加权,通过参数量权值对计算比重进行加权,获得加权计算力和加权参数量;
对所述加权计算力和加权参数量进行整合,获得裁剪度参数。
3.根据权利要求1所述的方法,其特征在于,基于所述裁剪度参数对所述待裁剪模型进行裁剪处理,获得裁剪模型,包括:
对所述裁剪度参数进行排序,获得第一排序信息;
根据所述第一排序信息筛选满足裁剪范围的裁剪层;
对所述满足裁剪范围的裁剪层进行裁剪处理,获得裁剪模型。
4.根据权利要求3所述的方法,其特征在于,所述裁剪处理为层裁剪;
相应的,对所述满足裁剪范围的裁剪层进行裁剪处理,获得裁剪模型,包括:
对所述满足裁剪范围的裁剪层进行重要性评价,获得第一评价信息;
根据所述第一评价信息对所述满足裁剪范围的裁剪层进行重要性排序,获得第二排序信息;
根据所述第二排序信息对所述满足裁剪范围的裁剪层进行裁剪,获得裁剪模型。
5.根据权利要求3所述的方法,其特征在于,所述裁剪处理为参数裁剪;
相应的,对所述满足裁剪范围的裁剪层进行裁剪处理,获得裁剪模型,包括:
获得所述满足裁剪范围的裁剪层的待裁剪参数,对所述待裁剪参数进行重要性评价,获得第二评价信息;
根据所述第二评价信息对所述待裁剪参数进行重要性排序,获得第三排序信息;
根据所述第三排序信息对所述待裁剪参数进行裁剪,获得裁剪模型。
6.一种模型裁剪设备,其特征在于,所述设备包括:
获得模块,用于获得与待裁剪模型对应的计算力权值和参数量权值,所述待裁剪模型包含至少两层裁剪层;其中,所述计算力权值用于表征模型计算力对模型裁剪贡献度的比值,参数量权值用于表征模型参数量对模型裁剪贡献度的比值;
分析模块,用于根据计算力权值和参数量权值对每一层裁剪层进行分析,以确定与裁剪层对应的裁剪度参数;
裁剪模块,用于基于所述裁剪度参数对所述待裁剪模型进行裁剪处理,获得裁剪模型。
7.根据权利要求6所述的设备,其特征在于,所述分析模块,包括:
确定子模块,用于确定与所述待裁剪模型对应的参数量和计算力;
归一化子模块,用于对所述参数量和计算力进行归一化处理,获得参数比重和计算比重;
加权子模块,用于通过计算力权值对参数比重进行加权,通过参数量权值对计算比重进行加权,获得裁剪度参数。
8.根据权利要求6所述的设备,其特征在于,所述裁剪模块,包括:
排序子模块,用于对所述裁剪度参数进行排序,获得第一排序信息;
筛选子模块,用于根据所述第一排序信息筛选满足裁剪范围的裁剪层;
裁剪子模块,用于对所述满足裁剪范围的裁剪层进行裁剪处理,获得裁剪模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011147814.X/1.html,转载请声明来源钻瓜专利网。