[发明专利]模型量化方法及装置、存储介质及电子设备在审
申请号: | 202110825902.9 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113537470A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 赵梦伟 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 量化 方法 装置 存储 介质 电子设备 | ||
1.一种模型量化方法,其特征在于,所述模型包括多个参考层,其中所述参考层包括卷积层和全连接层中的至少一个,所述方法包括:
获取所述参考层中权重的离群值,并根据所述离群值确定所述参考层中的目标通道;
复制各所述目标通道,并根据各所述目标通道的复制次数调整各所述目标通道中的权重值以得到与所述参考层对应的目标层;
对各所述目标层进行量化处理,并根据各所述目标通道的数量确定各所述目标通道对应输入通道的数量以完成对所述模型的量化。
2.根据权利要求1所述的方法,其特征在于,所述根据所述离群值确定所述参考层中的目标通道,包括:
确定各所述离群值对应的参考通道,并确定各所述参考通道中的离群值的数量;
根据所述参考通道的数量和所述参考层中的总通道数设定分离通道系数;
根据所述参考通道中的离群值的数量和所述分离通道系数在参考通道中确定目标通道。
3.根据权利要求2所述的方法,其特征在于,所述根据所述参考通道中的离群值的数量和所述分离通道系数在参考通道中确定目标通道,包括:
根据所述分离通道系数和所述参考层中的总通道数确定所述目标通道的数量;
根据各所述参考通道中的离群值的数量确定各所述参考通道的优先级;
根据所述目标通道的数量和所述优先级确定在所述参考通道中确定目标通道。
4.根据权利要求1所述的方法,其特征在于,在对各所述目标层进行量化处理之前,所述方法还包括:
若所述目标层中的目标通道中的权重存在离群值;
则对所述离群值所在的各所述目标通道均进行一次复制,并将各所述目标通道中的权重值减半以更新所述目标层。
5.根据权利要求1所述的方法,其特征在于,所述根据各所述目标通道的复制次数调整各所述目标通道中的权重值,包括:
根据各所述目标通道的复制次数确定各所述目标通道的数量;
利用权重值调整公式根据各所述目标通道的数量调整各所述目标通道中的权重值,其中所述权重值调整公式为:
其中,wnew表示调整后权重值,n表示目标通道的数量,wold表示调整前权重值。
6.根据权利要求1所述的方法,其特征在于,所述根据各所述目标通道的数量确定各所述目标通道对应输入通道的数量,包括:
为所述目标层配置一自定义层,所述自定义层用于根据各所述目标通道的数量复制各所述目标通道对应的输入通道,以使得各所述目标通道与各所述目标通道对应输入通道的数量相同。
7.根据权利要求1所述的方法,其特征在于,所述获取所述参考层中权重的离群值,包括:
获取所述参考层的权重的直方图;
根据所述直方图确定所述权重中的离群值。
8.一种模型量化装置,其特征在于,所述模型包括多个参考层,其中所述参考层包括卷积层和全连接层中的至少一个,所述装置包括:
确定模块,用于获取所述参考层中权重的离群值,并根据所述离群值确定所述参考层中的目标通道;
复制模块,用于复制各所述目标通道,并根据各所述目标通道的复制次数调整各所述目标通道中的权重值以得到与所述参考层对应的目标层;
量化模块,用于对各所述目标层进行量化处理,并根据各所述目标通道的数量确定各所述目标通道对应输入通道的数量以完成对所述模型的量化。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的模型量化方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的模型量化方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110825902.9/1.html,转载请声明来源钻瓜专利网。