[发明专利]运行神经网络模型的方法、装置和计算机设备在审
申请号: | 201910996290.2 | 申请日: | 2019-10-18 |
公开(公告)号: | CN112686365A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 何占盈;郑淼;何雷骏 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 颜晶 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运行 神经网络 模型 方法 装置 计算机 设备 | ||
1.一种运行神经网络模型的方法,其特征在于,所述方法包括:
获取当前卷积层的输入数据和权重参数数据;
对所述输入数据进行winograd处理,得到待运算的输入数据;
对所述权重参数数据进行winograd处理;
降低winograd处理后的权重参数数据的数据位数目,对降位后的权重参数数据进行量化处理,得到待运算的权重参数数据;
基于所述待运算的输入数据和所述待运算的权重参数数据进行卷积运算,得到中间输出数据;
对所述中间输出数据进行反量化处理;
对反量化处理后的中间输出数据进行winograd结果变换处理,得到所述当前卷积层的输出数据。
2.根据权利要求1所述的方法,其特征在于,所述winograd处理后的权重参数数据为带符号位的定点型的数据,所述降低winograd处理后的权重参数数据的数据位数目,包括:
如果所述winograd处理后的权重参数数据中除了符号位之外的最高预设数目个数据位的数值都是0,则保留所述winograd处理后的权重参数数据中的所述符号位以及除了所述最高预设数目个数据位之外的数据位上的数值,得到降位后的权重参数数据;或者
如果所述最高预设数目个数据位中的任一数据位的数值是1,则保留所述winograd处理后的权重参数数据中的所述符号位以及除了所述最高预设数目个数据位之外的数据位,将所述除了所述最高预设数目个数据位之外的数据位的数值都设置为1,得到降位后的权重参数数据。
3.根据权利要求2所述的方法,其特征在于,所述降位后的权重参数数据为带符号位的定点型的数据;
所述对降位后的权重参数数据进行量化处理,包括:
确定所述降位后的权重参数数据中小数位数目;
基于所述小数位数目,确定乘积因子;
将所述降位后的权重参数数据乘以所述乘积因子,得到整数型的权重参数数据;所述对所述中间输出数据进行反量化处理,包括:
获取量化因子;
将所述量化因子除以所述乘积因子,得到变换后的量化因子;
基于所述变换后的量化因子,对所述中间输出数据进行反量化处理。
4.根据权利要求3所述的方法,其特征在于,所述基于所述小数位数目,确定乘积因子,包括:
将2的所述小数位数目次幂,确定为乘积因子。
5.根据权利要求3所述的方法,其特征在于,所述量化因子为对初始权重参数数据进行量化处理的过程中使用的量化因子。
6.根据权利要求3所述的方法,其特征在于,所述当前卷积层的输入数据和权重参数数据分别为8位整数型的数据,所述待运算的输入数据为10位整数型的数据,所述winograd处理后的权重参数数据的整数部分为10位且小数部分为2位,所述待运算的权重参数数据为10位整数型的数据。
7.根据权利要求6所述的方法,其特征在于,所述基于所述待运算的输入数据和所述待运算的权重参数数据进行卷积运算,包括:
控制乘累加器基于所述待运算的输入数据和所述待运算的权重参数数据进行卷积运算,其中,所述乘累加器为支持10位整数型的数据进行卷积运算的乘累加器。
8.根据权利要求1所述的方法,其特征在于,在获取当前卷积层的输入数据和权重参数数据之前,所述方法还包括:
获取当前卷积层的初始输入数据和初始权重参数数据;
所述获取当前卷积层的输入数据和权重参数数据,包括:
对所述初始输入数据进行量化处理,得到所述当前卷积层的输入数据;
对所述初始权重参数数据进行量化处理,得到所述当前卷积层的权重参数数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910996290.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模型获取方法、装置及存储介质
- 下一篇:具有散热结构的电路板及其制作方法