[发明专利]神经网络模型的量化方法、装置及设备在审
申请号: | 202110581957.X | 申请日: | 2021-05-25 |
公开(公告)号: | CN113326920A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 康瑞鹏;游亮;龙欣 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 张艳梅;冯德魁 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 量化 方法 装置 设备 | ||
1.一种神经网络模型的量化方法,其特征在于,包括:
获得待量化的神经网络模型的目标运算模块包含的第一运算分支和第二运算分支;其中,第一运算分支的运算层数大于第二运算分支的运算层数;
将所述第一运算分支量化为第一精度;
将所述第二运算分支量化为第二精度;所述第一精度小于第二精度。
2.根据权利要求1所述的方法,其特征在于,所述第一运算分支为包含多层运算的第一运算分支;所述第二运算分支为短路分支。
3.根据权利要求1所述的方法,其特征在于,所述第一精度为八位整形精度;所述第二精度为半精度浮点数精度。
4.根据权利要求1所述的方法,其特征在于,所述获得待量化的神经网络模型的目标运算模块包含的第一运算分支和第二运算分支,包括:
确定待量化的神经网络模型的目标运算模块;
根据目标运算模块,获得待量化的神经网络模型的目标运算模块包含的第一运算分支和第二运算分支。
5.根据权利要求4所述的方法,其特征在于,所述确定待量化的神经网络模型的目标运算模块,包括:
遍历所述待量化的神经网络模型;
判断当前运算操作的输出是否经过两个运算分支,若是,则将当前运算操作的输出作为目标运算模块的起始位置;
确定目标运算模块的合并位置;将目标运算模块的起始位置至合并位置之间的运算操作作为目标运算模块。
6.根据权利要求5所述的方法,其特征在于,所述确定目标运算模块的合并位置,包括:
获得预设的合并位置标识;
根据所述合并位置标识,确定目标运算模块的合并位置。
7.根据权利要求1所述的方法,其特征在于,还包括:
将神经网络模型中所述目标运算模块之外的运算模块量化为第二精度。
8.一种神经网络模型的量化装置,其特征在于,包括:
分支获得单元,用于获得待量化的神经网络模型的目标运算模块包含的第一运算分支和第二运算分支;其中,第一运算分支的运算层数大于第二运算分支的运算层数;
第一运算分支量化单元,用于将所述第一运算分支量化为第一精度;
第二运算分支量化单元,用于将所述第二运算分支量化为第二精度;所述第一精度小于第二精度。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储神经网络模型的量化方法的程序,该设备通电并通过所述处理器运行该神经网络模型的量化方法的程序后,执行下述步骤:
获得待量化的神经网络模型的目标运算模块包含的第一运算分支和第二运算分支;其中,第一运算分支的运算层数大于第二运算分支的运算层数;
将所述第一运算分支量化为第一精度;
将所述第二运算分支量化为第二精度;所述第一精度小于第二精度。
10.一种存储介质,其特征在于,存储有数据处理方法的程序,该程序被处理器运行,执行下述步骤:
获得待量化的神经网络模型的目标运算模块包含的第一运算分支和第二运算分支;其中,第一运算分支的运算层数大于第二运算分支的运算层数;
将所述第一运算分支量化为第一精度;
将所述第二运算分支量化为第二精度;所述第一精度小于第二精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110581957.X/1.html,转载请声明来源钻瓜专利网。