[发明专利]一种量化模型的生成方法及终端有效
申请号: | 202011601798.7 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112651500B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 潘成龙;张宇;刘东剑 | 申请(专利权)人: | 深圳金三立视频科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 深圳市博锐专利事务所 44275 | 代理人: | 张鹏 |
地址: | 518000 广东省深圳市龙华区龙华街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 量化 模型 生成 方法 终端 | ||
1.一种量化模型的生成方法,其特征在于,包括步骤:
利用预设数据集对目标检测模型进行训练,得到收敛后的浮点型的目标检测模型;
对所述目标检测模型进行量化并基于梯度估计进行训练,得到收敛后的第一量化模型;
将所述目标检测模型与所述第一量化模型基于两者的联合损失函数进行联合训练,得到收敛后的与所述第一量化模型对应的第二量化模型;
所述量化方法如下式所示:
r=Round(S(q-Z));
式中,q表示所述收敛后的浮点型的目标检测模型的float32权重,Z表示所述收敛后的浮点型的目标检测模型的float32数值在量化时的偏移量,S表示所述收敛后的浮点型的目标检测模型的float32数值的缩放因子,即尺度,Round()表示四舍五入取整的数学函数,r表示量化后的一个整数值,n表示量化的bit数,x为当前待量化神经网络层的所有权重值;
所述梯度估计使用直通估计器,如下式所示:
式中,L为所述第一量化模型的损失函数,q为所述收敛后的浮点型的目标检测模型的权重,r为所述第一量化模型的权重;
所述将所述目标检测模型与所述第一量化模型基于两者的联合损失函数进行联合训练,得到收敛后的与所述第一量化模型对应的第二量化模型之前包括:
根据所述目标检测模型和第一量化模型各自的分类损失函数、联合分类损失函数、各自的回归损失函数和联合回归损失函数确定两者的联合损失函数。
2.根据权利要求1所述的一种量化模型的生成方法,其特征在于,所述联合分类损失函数为:
式中,Pfp32表示所述目标检测模型对目标的分类概率,Pint8表示第一量化模型对目标的分类概率,N表示预测的目标个数;
所述联合回归损失函数为:
式中,xfp32与xint8分别表示所述目标检测模型与所述第一量化模型输出的目标中心横坐标,yfp32和yint8分别表示所述目标检测模型与所述第一量化模型输出的目标中心纵坐标,wfp32和wint8分别表示所述目标检测模型与所述第一量化模型输出的目标宽,hfp32和hint8分别表示所述目标检测模型与所述第一量化模型输出的目标高。
3.根据权利要求2所述的一种量化模型的生成方法,其特征在于,所述联合损失函数为:
Ltotal=αLKL+βLhard_regression+Lori
式中,Lori表示所述目标检测模型与所述第一量化模型各自的分类损失与回归损失之和,α表示调节联合分类损失权重的参数,β表示调节联合回归损失权重的参数。
4.根据权利要求1至3中任一项所述的一种量化模型的生成方法,其特征在于,所述将所述目标检测模型与所述第一量化模型基于两者的联合损失函数进行联合训练,得到收敛后的与所述第一量化模型对应的第二量化模型包括:
基于两者的联合损失函数进行联合训练后,判断所述第一量化模型的客观评测数据是否达到预设值,若是,则得到收敛后的与所述第一量化模型对应的第二量化模型;若否,则根据预设数据集基于所述联合损失函数继续对所述目标检测模型与所述第一量化模型进行联合训练直至所述第一量化模型的客观评测数据达到预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳金三立视频科技股份有限公司,未经深圳金三立视频科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011601798.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:沿周向打印的打印设备
- 下一篇:基于高斯过程回归的转向路感模拟方法