[发明专利]针对基于CNN的立体匹配算法的量化方法在审
申请号: | 202010558891.8 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111696149A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 鲁志敏;王君鹏;陈松 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06T7/593 | 分类号: | G06T7/593;G06N3/04;G06N3/08 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 基于 cnn 立体 匹配 算法 量化 方法 | ||
1.一种针对基于CNN的立体匹配算法的量化方法,其特征在于,包括:
在推理过程中,采用线性定点化的方式,将浮点形式的权重量化为整数值;
单个卷积运算中,将量化后的输入特征图与量化后的权重进行整数运算,整数运算使用累加器进行乘积累加,累加器中引入了带量化的偏置加法,偏置项使用与权重相同的方式量化;累加器的输出进入激活层,激活层采用ReLU6()函数将最终输出控制在设定的范围内。
2.根据权利要求1所述的采用线性定点化的方式,其特征在于,所述将浮点形式的权重量化为整数值包括:
将浮点形式的权重量化为int8,即位宽为8bit的整数值;其中,第1个bit为符号位,1代表为负数,0代表值为正,第2个bit为整数位;后6个bit为小数位;
量化公式表示为:
xQ=clamp(-(Nlevel-1),(Nlevel-1),xint)
其中,x表示浮点形式的权重,其为实数值;S表示量化参数,round(.)表示四舍五入的函数;N1表示小数位所占位宽,也即N1=6;Nlevel=28-1;xQ表示权重量化后得到的整数值。
3.根据权利要求1所述的采用线性定点化的方式,其特征在于,将量化后的输入特征图与量化后的权重进行整数运算包括:
假设浮点形式的特征图r1与浮点形式的权重r2的大小均为N×N;计算r1与r2的乘积表示为:r3=r1r2;
将矩阵rα第i行第j列元素表示为其中1≤i,j≤N,并且将其量化为Sα的量化参数,量化后的矩阵qα第i行第j列元素表示为则:
根据矩阵乘法的定义:
得到:
其中,k表示矩阵中的列号,1≤k≤N,Sα表示矩阵rα的量化参数;
将q1作为量化后的权重,q2作为量化后的输入特征图,q3为整数运算结果;卷积神经网络下一层中的输入特征图是上一层中激活层的输出,对应的量化参数S是相同的,即S2=S3,则乘法因子M仅与量化参数S1相关;记量化后的权重中小数位所占位宽为N1,则
乘上一个M值后,通过将数据右移N1位即可实现的乘法运算。
4.根据权利要求1或3所述的采用线性定点化的方式,其特征在于,量化后的输入特征图与量化后的权重分别为和int12和int8,累加int8和int12的乘积采用一个32bit的累加器;
32bit的累加器中引入带量化的偏置加法,即将偏置项量化为int16;偏置项量化使用与权重相同的方式,区别在于,偏置项量化时的量化参数S′为权重量化参数S1及输入特征图量化参数S2的乘积:其中,N2表示量化后的输入特征图中小数位所占位宽。
5.根据权利要求1或2所述的采用线性定点化的方式,其特征在于,激活层采用ReLU6()函数将最终输出控制在[0,6]之间,则表示整数部分的数据位宽为3bit,首端使用1个bit为符号位,1代表为负数,0代表值为正;末端则使用8bit表示小数位;采用与权重相同的方式量化,区别在于,激活层输出量化时的量化参数为S”=1/28。
6.根据权利要求1或2所述的采用线性定点化的方式,其特征在于,每一卷积层之后引入了批归一化层,训练时作为一个单独的操作模块,推理过程将批归一化层融入至相应的卷积层中一起进行量化,即将批归一化层参数折叠为卷积层的权重和偏置项;首先,按批处理归一化参数缩放权重与偏置项:
其中,γ是批处理归一化的比例参数,是整个批次中卷积结果方差的估计值,μB是整个批次中卷积结果的均值,ε是设定的常数值;
再对于获得的权重ω:fold与偏置项bias进行量化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010558891.8/1.html,转载请声明来源钻瓜专利网。