[发明专利]一种神经网络的非均匀量化方法有效
申请号: | 202011616502.9 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112712164B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 黄宇扬;冯建豪;陈家麒 | 申请(专利权)人: | 上海熠知电子科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06C3/00;G06F17/15 |
代理公司: | 上海智晟知识产权代理事务所(特殊普通合伙) 31313 | 代理人: | 张瑞莹;张东梅 |
地址: | 200060 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 均匀 量化 方法 | ||
1.一种神经网络的非均匀量化方法,其特征在于,包括步骤:
采用分段函数,将输入数据量化为第一定点数,进行储存;
查找第一查找表,确认所述第一定点数对应的第二定点数,其中所述第二定点数的比特数高于所述第一定点数;
采用所述第二定点数进行卷积运算,得到计算结果;以及
查找第二查找表,将所述计算结果转换为第三定点数进行储存,所述第三定点数的数据类型与所述第一定点数相同,其中,所述第一查找表及第二查找表配置于芯片内部。
2.如权利要求1所述的非均匀量化方法,其特征在于,所述第一定点数的数据类型为8比特定点数。
3.如权利要求1所述的非均匀量化方法,其特征在于,所述分段函数的各段函数为斜率不同或相同的一次函数:
其中,,,为用于表征范围内输入数据的第一定点数的取值范围。
4.如权利要求3所述的非均匀量化方法,其特征在于,所述分段函数为:
其中,为所述输入数据r的取值范围,k为0-1之间的任意数。
5.如权利要求1所述的非均匀量化方法,其特征在于,所述第一查找表的形成包括步骤:
确认输入数据的取值范围,并将所述取值范围内的数据根据所述分段函数进行量化,得到第一数据;
根据所述分段函数 ,将所述第一数据反量化为浮点数;
将所述浮点数量化为第二数据;以及
将所述第一数据及其对应的第二数据配置为第一查找表。
6.如权利要求5所述的非均匀量化方法,其特征在于,所述浮点数量化为第二数据采用线性函数将浮点数进行量化,且原始浮点数r和量化后的第二数据q有如下关系:
其中,scale及zeroPoint由量化区间上下界经过计算得出。
7.如权利要求1所述的非均匀量化方法,其特征在于,所述第二查找表的形成包括步骤:
估算卷积计算结果的取值范围;
在所述取值范围内,建立低比特定点数到高比特定点数的映射表;以及
对于每一个可能的高比特定点数取值,在所述映射表内,找到最近的被映射的数,形成第二查找表。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,所述指令在被执行时使系统执行权利要求1至7中任一项所述方法。
9. 一种神经网络的非均匀量化系统,其特征在于,包括:
存储器;以及
处理器,所述处理器与所述存储器耦合,并用于执行权利要求1至7中任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海熠知电子科技有限公司,未经上海熠知电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011616502.9/1.html,转载请声明来源钻瓜专利网。