[发明专利]自适应模型量化方法及装置、存储介质及电子装置在审
申请号: | 202211708555.2 | 申请日: | 2022-12-28 |
公开(公告)号: | CN115952832A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 易冠先;王康;刘德龙;陈波扬;殷俊 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 刘旺贵 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 模型 量化 方法 装置 存储 介质 电子 | ||
1.一种自适应模型量化方法,其特征在于,包括:
确定原始神经网络模型中的N个层中待量化的参数,得到N组参数,其中,N为大于或等于2的正整数;
对所述N组参数执行初次量化,并获取所述N组参数被量化所产生的总精度损失值,其中,所述总精度损失值用于表示所述N组参数被量化前所述N个层的输出与被量化后所述N个层的输出之间的精度损失;
在所述总精度损失值大于预设的精度损失阈值的情况下,对所述N组参数执行M次量化,直到所述N组参数被量化所产生的总精度损失值小于或等于所述精度损失阈值,其中,M为大于或等于1的正整数,在所述M次量化中的各次量化中,所述N组参数中的部分组参数被量化;
将在所述N组参数被量化所产生的总精度损失值小于或等于所述精度损失阈值时的所述原始神经网络模型确定为目标神经网络模型,并将待处理的媒体资源信息输入到所述目标神经网络模型,得到所述目标神经网络模型输出的所述媒体资源信息的目标处理结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述N组参数执行M次量化,包括:
获取第i次量化后所述N组参数中的各组参数对应的精度损失值,得到第i次的N个精度损失值,其中,i为大于或等于1的正整数;
根据所述第i次的N个精度损失值,确定所述第i次量化后所述N组参数被量化所产生的总精度损失值;
在所述第i次量化后所述N组参数被量化所产生的总精度损失值大于所述精度损失阈值的情况下,根据所述第i次的N个精度损失值,在所述N组参数中确定待执行第i+1次量化的部分组参数;对确定出的所述待执行第i+1次量化的部分组参数执行所述第i+1次量化;
在所述第i次量化后所述N组参数被量化所产生的总精度损失值小于或等于所述精度损失阈值的情况下,结束对所述N组参数执行所述M次量化。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第i次的N个精度损失值,确定所述第i次量化后所述N组参数被量化所产生的总精度损失值,包括:
获取预先为所述N个层设置的N个权重值,其中,所述N个权重值与所述N个层具有一一对应的关系;
对所述N个权重值和所述第i次的N个精度损失值执行加权求和操作,得到所述第i次量化后所述N组参数被量化所产生的总精度损失值。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第i次的N个精度损失值,在所述N组参数中确定待执行第i+1次量化的部分组参数,包括:
在预先为所述N个层设置了N个权重值的情况下,将所述第i次的N个精度损失值与所述N个权重值进行对应相乘,得到N个加权精度损失值,其中,所述N个权重值与所述N个层具有一一对应的关系,所述N个加权精度损失值中的第j个加权精度损失值是将所述第i次的N个精度损失值中的第j个精度损失值与所述N个权重值中的第j个权重值进行对应相乘所得到的加权精度损失值,所述第j个精度损失值和所述第j个权重值均与所述N个层中的第j层对应,j为大于或等于1、且小于或等于N的正整数;
将所述第i次量化后的所述N组参数中所述加权精度损失值从大到小排在前K位的K组参数确定为所述待执行第i+1次量化的部分组参数,其中,K等于1或K为小于N的正整数。
5.根据权利要求2所述的方法,其特征在于,所述对确定出的所述待执行第i+1次量化的部分组参数执行所述第i+1次量化,包括:
在所述待执行第i+1次量化的部分组参数包括所述第i次量化后的所述N组参数中的K组参数、且所述K组参数在执行第i次量化时使用的量化参数为第i次的K个量化参数的情况下,将所述第i次的K个量化参数调整为第i+1次的K个量化参数,其中,K等于1或K为小于N的正整数;
使用所述第i+1次的K个量化参数对所述第i次量化后的所述K组参数执行所述第i+1次量化。
6.根据权利要求5所述的方法,其特征在于,所述将所述第i次的K个量化参数调整为第i+1次的K个量化参数,包括:
以所述第i次的K个量化参数为初始值,缩小所述第i次的K个量化参数中的量化输入范围;和/或
以所述第i次的K个量化参数为初始值,增大所述第i次的K个量化参数中的量化位宽。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211708555.2/1.html,转载请声明来源钻瓜专利网。