[发明专利]一种动态混合精度模型构建方法及系统在审

专利信息
申请号: 202110491111.7 申请日: 2021-05-06
公开(公告)号: CN113076663A 公开(公告)日: 2021-07-06
发明(设计)人: 郭锴凌;杨弈才;徐向民;邢晓芬 申请(专利权)人: 华南理工大学
主分类号: G06F30/20 分类号: G06F30/20
代理公司: 广州海心联合专利代理事务所(普通合伙) 44295 代理人: 黄为;冼俊鹏
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 动态 混合 精度 模型 构建 方法 系统
【说明书】:

发明公开了一种动态混合精度模型构建方法及系统,涉及深度神经网络技术。针对现有技术中可转换的状态数量及精度问题提出本方案,特点在于根据全精度模型中不同块的参数的海森矩阵的平均迹以及可选参数精度表S构建混合精度状态转换表;并在训练过程中采用每次训练迭代随机采样数个混合精度子模型,用改进的量化函数进行量化操作,得到混合精度模型;根据实际部署需求组成混合比特部署状态表进行实际部署。优点在于,利用海森矩阵平均迹和随机采样,减少了训练所需的搜索空间与计算量,同时改进的量化函数可以在不同量化比特间直接迁移且量化误差小,使得混合精度模型可以自适应地部署在较低比特的情景,同时在较高比特情景的精度亦有改善。

技术领域

本发明涉及深度神经网络技术,尤其涉及一种动态混合精度模型构建方法及系统。

背景技术

近年来,越来越多智能设备部署了深度神经模型,如手机和VR眼镜等。深度神经模型通常需要大量的内存占用和昂贵的计算操作,而智能设备的内存和计算资源是有限的。考虑到更复杂的实际应用场景,即使是同一台设备,对深度神经模型的要求也会因电池状况、硬件老化等因素变化而变化。这给智能设备的部署工作带来了更大的难度,不利于神经网络算法的轻量级应用。

为解决深度神经网络过高的内存占用和计算需求,研究人员提出了对神经网络模型进行量化压缩的方法。经过量化后的神经网络模型拥有更少的内存占用和计算量,可以显著减少存储和计算资源的开支,更好地部署在资源受限的轻量级设备上。

针对智能设备实际应用场景实时变化的问题,研究人员提出可以人工设计或者使用神经网络搜索方法为不同的应用需求单独设计和训练一个或多个神经网络模型。但这两种方法需要消耗过高的设计和训练成本,不利于实际推广使用。一个更高效的解决方案就是使用自适应模型,自适应模型指仅设计和训练一个模型,该模型具备多种转换状态,每个状态对应一个子模型。自适应模型可以根据实际使用场景变化自适应改变自身结构参数,转换成不同的子模型。

自适应量化模型结合了自适应模型和量化方法,可以自适应改变模型的参数和计算精度。然而,当前的自适应量化模型存在两个弊端,一方面,无法应用于参数和计算精度较低的情况;另一方面,可使用的转换状态有限,每个转换状态都是一个单一比特的子模型。

为了应对自适应模型各个子模型的统计参数不匹配的问题,自适应剪枝模型使用Switch BN(Batch Normalization)层替换传统的BN层,Switch BN层包含数个维度一致但参数不同的BN层,每个BN层对应一种通道数。自适应量化模型同样采用了Switch BN层,其中每个BN层对应一种比特精度。对量化模型的激活层进行可学习的参数化裁剪(ClippingLevel)可以有效提升性能,自适应量化模型也将Clipping Level改进为Switch ClippingLevel层。其中,每个ReLU激活层增加了数个不同的可学习参数,每个参数对应一种比特精度。

近年来,研究人员发现深度神经模型的参数的海森矩阵可用于分析神经网络模型不同层或块对噪声扰动的敏感度,进一步地提出使用海森矩阵信息训练混合精度模型。混合精度模型不同单一精度的量化模型,其不同的层或块具有不同的参数精度。研究表明,混合精度模型较单一精度量化模型具有更优的性能和精度表现。

然而,当前的自适应量化模型存在难以在较低比特场景应用的难题,同时可转换的状态有限,这两个弊端极大限制了自适应量化模型的推广使用。如何利用具体的海森矩阵信息有效增加自适应量化模型的转换状态以及提升精度成了亟需解决的问题。

发明内容

本发明目的在于提供一种动态混合精度模型构建方法及系统,以解决上述现有技术存在的问题。

本发明所述动态混合精度模型构建方法,包括以下步骤:

S1、对原始数据进行预处理;

S2、训练一个全精度模型;

S3、给定可选参数精度表S;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110491111.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top