[发明专利]一种优化int8的量化方法及系统在审

专利信息
申请号: 202010863091.7 申请日: 2020-08-25
公开(公告)号: CN111950716A 公开(公告)日: 2020-11-17
发明(设计)人: 谢远东 申请(专利权)人: 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/063;G06N3/08
代理公司: 北京冠和权律师事务所 11399 代理人: 安琪
地址: 100000 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 优化 int8 量化 方法 系统
【说明书】:

发明提供了一种优化int8的量化方法及系统,所述方法执行以下步骤:获取训练神经网络后保存的浮点模型;计算神经网络各层中各通道中的权重量化缩放因子;采用KL散度算法计算神经网络各层中的激活值量化缩放因子;根据余弦距离确定神经网络各层中的最优权重量化缩放因子和最优激活值量化缩放因子;基于最优权重量化缩放因子和最优激活值量化缩放因子,得到int8的整型结果。根据本发明的方法,根据最优权重量化缩放因子和最优激活值量化缩放因子,自动进行微调,得到int8的整型结果,可以避免极端值的影响;同时,采用KL散度计算激活值量化缩放因子,并利用余弦距离自动地进行微调,可以减小量化误差,避免极端值的影响。

技术领域

本发明涉及深度学习技术领域,特别涉及一种优化int8的量化方法及系统。

背景技术

深度学习理论及其相关技术日新月异的今天,其相关的应用也越来越多地出现在大众的视野当中。优秀的深度学习及人工智能技术不断地被应用在我们的日常生活当中,如图片、视频处理、自动驾驶、人脸识别等等,但同时大量的浮点运算、内存、电量开销,使得目前这些应用仍然存在着运行成本高昂、速度缓慢、并行处理效率较低等问题。比如在这些应用中最常用的深度卷积神经网络模型ResNet50(深度残差网络50),其浮点运算量达到了4.14GFlops(每秒千兆次浮点运算)。一款定制的自动驾驶软件动辄几万甚至几十万,专业图片与视频的处理仍然需要远端强大的服务器处理,商场大流量的人脸检测与监控需要专门的机房用来运行相关的设备及软件等等。使用成本与运行效率等成为了人工智能技术在相关移动及嵌入式设备上部署和应用小型化的瓶颈和障碍。

目前解决运算开销和使用成本的方案有深度卷积网络模型的深度压缩和量化,针对卷积运算优化的低秩分解、网络模型蒸馏以及小型化网络的设计。在这些解决方案当中,共同的目标是尽量要保持数据集的测试精度,又能有效地降低计算量,提高计算效率,降低相应的开销。网络模型的深度压缩和量化作为简单且高效的解决方案,一直被人们研究和使用,其他几种解决方案因实现的复杂性,不同的网络结构需要深度定制,不能够很好地达到相关深度卷积网络模型地精度等原因而不被大家广泛使用。深度卷积网络模型的量化可将计算设备上的浮点运算转化为整数甚至移位计算,它不仅是网络模型压缩的关键同时可大幅降低网络计算的时间和开销。

目前int8(8位整型)的量化方法是针对校准数据集获取激活值,对激活值进行2的次幂膨胀量化,并统计每一层的量化指数直方图;根据每一层的量化指数直方图计算得到层量化指数的均值并将均值设置为量化指数的上限,然后进行定点乘加,达到加速效果。然而,这种量化方法的弊端在于,当通道有极大值时,量化误差极大。

为了解决生成量化表非最优,影响量化精度的问题,亟需一种优化int8的量化方法及系统。

发明内容

本发明提供一种优化int8的量化方法及系统,用以解决生成量化表非最优,影响量化精度的问题。

本发明提供了一种优化int8的量化方法,所述方法执行以下步骤:

步骤1:获取训练神经网络后保存的浮点模型;

步骤2:计算所述神经网络各层中各通道中的权重量化缩放因子;

步骤3:采用KL散度算法计算所述神经网络各层中的激活值量化缩放因子;

步骤4:根据余弦距离确定所述神经网络各层中的最优权重量化缩放因子和最优激活值量化缩放因子;

步骤5:基于所述最优权重量化缩放因子和所述最优激活值量化缩放因子,得到int8的整型结果。

进一步地,在所述步骤2中,根据以下公式计算所述神经网络各层中各通道中的权重量化缩放因子:

scale=127/xmax (1)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010863091.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top