[发明专利]用于深度神经网络的基于光标的自适应量化有效

专利信息
申请号: 201980060253.9 申请日: 2019-09-24
公开(公告)号: CN112840358B 公开(公告)日: 2023-05-23
发明(设计)人: 李抱朴;范彦文;程治宇;包英泽 申请(专利权)人: 百度时代网络技术(北京)有限公司;百度(美国)有限责任公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;王艳春
地址: 100080 北京市海淀区东*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 深度 神经网络 基于 标的 自适应 量化
【权利要求书】:

1.一种用于减小包括多个层的神经网络的存储器大小的计算机实现方法,所述方法包括:

响应于没有达到停止条件,执行包括以下各项的步骤:

将从包括输入数据和对应地面真值数据的训练数据集获得的训练数据批次输入到所述神经网络中以获得训练数据输出;

给定来自所述神经网络的所述训练数据输出和损失函数,确定所述神经网络的训练数据损失,所述损失函数包括与所述神经网络的预测准确度相关的损失分量和与在量化之后的所述神经网络的参数值的存储器大小相关的压缩分量;

使用所述训练数据损失更新所述神经网络的所述参数值中的至少一些;

将从包括输入数据和对应地面真值数据的验证数据集获得的验证数据批次输入到所述神经网络中以获得验证数据输出;

给定来自所述神经网络的所述验证数据输出和所述损失函数,确定所述神经网络的验证数据损失;

使用所述验证数据损失更新所述神经网络的所述层中的至少一些的光标值,其中所述神经网络中的层的光标值与用于表示该层的参数值的存储器大小相关;以及

针对所述层中的至少一些中的每个层,使用界定该层的光标值的两个整数来量化所述神经网络的该层的参数值,经过量化的参数值用于确定所述损失函数的所述压缩分量;以及

响应于达到停止条件:

输出所述神经网络的所述层中的所述至少一些的最终光标值,其中所述神经网络的层的最终光标值是用于表示所述神经网络的该层的参数值的位大小;以及

输出所述神经网络的一组参数值。

2.根据权利要求1所述的计算机实现方法,其中量化所述神经网络的层的参数值的步骤包括:

针对所述层的所述光标值,识别上限整数值和下限整数值,其中所述上限整数值和所述下限整数值是界定所述光标值并表示用于表示所述层的参数值的存储器位大小的两个最近整数值;以及

将所述层的所述参数值量化为上限参数值集,在所述上限参数值集中参数值具有所述上限整数值的最大位大小;以及

将所述层的所述参数值量化为下限参数值集,在所述下限参数值集中参数值具有所述下限整数值的最大位大小。

3.根据权利要求1所述的计算机实现方法,其中输出最终光标值和输出所述神经网络的所述一组参数值的步骤包括:

针对来自最终迭代的不是整数值的每个光标值,将所述光标值舍入到整数值;以及

使用所述最终光标值来量化来自所述最终迭代的所述参数值以获得所述神经网络的所述一组参数值。

4.根据权利要求3所述的计算机实现方法,其还包括:

执行微调操作以调整所述一组参数值中的至少一些。

5.根据权利要求2所述的计算机实现方法,其中所述压缩分量包括:

给定所述参数值的量化的所述神经网络的总存储器大小相对于在量化之前的所述神经网络的存储器大小的比率;以及

控制所述神经网络的准确度与参数值的压缩之间的权衡的正则化因子。

6.根据权利要求5所述的计算机实现方法,其中所述比率由影响所述比率在所述损失函数中的重要性的参数来更改。

7.根据权利要求5所述的计算机实现方法,其中给定所述参数值的量化的所述神经网络的所述总存储器大小表示使用所述上限参数值集和所述下限参数值集获得的融合。

8.根据权利要求1所述的计算机实现方法,其还包括:

不对所述神经网络的第一层的参数值进行量化;

不对所述神经网络的最后一层的参数值进行量化;或者

不对所述神经网络的所述第一层和所述最后一层的参数值进行量化。

9.根据权利要求1所述的计算机实现方法,其还包括:

初始化所述神经网络的所述层中的至少一些的光标值;

初始化所述神经网络的所述参数值;以及

初始化批次大小。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度时代网络技术(北京)有限公司;百度(美国)有限责任公司,未经百度时代网络技术(北京)有限公司;百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201980060253.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top