[发明专利]一种强化学习自动感知权重分布的卷积神经网络量化方法在审
申请号: | 202110134308.5 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112733964A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 任鹏举;涂志俊;马建;夏天;赵文哲;陈飞;郑南宁 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/063;G06N3/08;G06N5/04 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 覃婧婵 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 强化 学习 自动 感知 权重 分布 卷积 神经网络 量化 方法 | ||
公开了一种强化学习自动感知权重分布的卷积神经网络量化方法,方法中,将每层批处理操作的参数与卷积操作的权重融合得到融合后的权重和偏置,获取浮点卷积神经网络模型中每一层融合后的权重的分布信息;根据每层权重的分布信息强化学习自动搜索最优的每层权重缩放系数,基于每层权重缩放系数将浮点权重量化成INT8类型数据;输入校准数据集,每输入一组数据记录每层输出特征图,选取众数作为每层输出特征图的缩放系数,根据每层权重的缩放系数和每层输出特征图的缩放系数计算得到每层偏置的缩放系数以将浮点的偏置量化为INT32类型的偏置,基于INT8类型数据、INT32类型的偏置和总的缩放系数构建前向推理过程完成量化。
技术领域
本发明属于人工智能的技术领域,特别是一种强化学习自动感知权重分布的卷积神经网络量化方法。
背景技术
近些年来随着以卷积神经网络为主导的人工智能技术的发展,越来越多的计算机视觉任务得到了很好的解决,如图像分类,目标检测和语义分割等。并且当前的一个发展趋势是在端侧平台上部署高性能的神经网络模型并能在真实场景中实时(大于30帧)运行,如移动端/嵌入式端设备。这些平台的特点是内存资源少,处理器性能不高,功耗受限,这使得目前精度最高的模型由于对内存和计算资源的超额要求使得根本无法在上面部署且达到实时性的要求。
为了解决这个矛盾,模型压缩技术应运而生,其主要是通过减少原始模型参数的数量或表示比特数来实现对内存和计算需求的降低,从而进一步降低能耗。目前性能最稳定的就是INT8的模型量化技术,相对于原始模型的FP32计算相比,INT8量化可将模型大小减少4倍,并将内存带宽要求减少4倍,对INT8计算的硬件支持通常快2到4倍。模型量化一般有三步操作,一是量化训练好的权重,二是利用校准数据集量化中间特征图,最后一步是如果存在较大的精度损失还需要额外的训练数据进行量化感知训练来恢复精度。当前流行的模型量化方案主要包括谷歌的TensorFlow Lite量化工具和英伟达的TensorRT INT8前向推理工具,这类技术假定卷积神经网络中各层之间相互独立,直接根据每层权重参数的最大最小值来对权重进行量化,而没有考虑层与层之间的相关性和依赖性,这样会计算出一些不合适的缩放系数使得权重量化之后有比较大的截断误差和归零误差,从而造成明显的精度损失,并且常常需要额外数据进行量化感知训练来恢复精度,而且他们采取的特征图校准方式是基于指数移动平均和Kullback-Leibler散度,这两种种方式要求提供大于一定数量的校准数据才能获得比较好的效果。然而在一些医学,生物相关领域,数据隐私非常重要,开发者很难获得数量巨大的校准数据集和训练数据集来保证良好的量化后精度。
强化学习是一系列用于解决马尔科夫决策问题的算法总称,它让智能体以“试错”的方式进行学习,通过不断地与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。环境提供的反馈信号只是对智能体产生动作好坏的评价,通常为标量信号,而没有告诉智能体如何去产生正确的动作,所以智能体必须学会在行动-评价的环境中获得知识,改进行动方案以适应环境。美国麻省理工韩松团队曾经使用强化学习去自动搜索混合精度量化策略,但混合精度的量化方法并不适用于目前绝大多数硬件,目前为止还没有看到用强化学习为卷积神经网络自动搜索每层最适合的缩放系数来解决传统量化中精度损失问题。
在背景技术部分中公开的上述信息仅仅用于增强对本发明背景的理解,因此可能包含不构成在本国中本领域普通技术人员公知的现有技术的信息。
发明内容
针对现有技术中存在的传统模型量化导致较大的精度损失问题和在量化过程中对校准数据集和训练数据集的依赖问题,本发明提出一种强化学习自动感知权重分布的卷积神经网络量化方法,本发明可用于在各类硬件平台上部署卷积神经网络时对模型的压缩量化。
本发明的目的是通过以下技术方案予以实现,一种强化学习自动感知权重分布的卷积神经网络量化方法包括以下步骤:
提供训练完毕的浮点卷积神经网络模型;
归一化处理输入数据以与所述浮点卷积神经网络模型的第一层卷积的参数融合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110134308.5/2.html,转载请声明来源钻瓜专利网。