[发明专利]基于工程化实现的卷积神经网络量化方法有效
申请号: | 201810319586.6 | 申请日: | 2018-04-11 |
公开(公告)号: | CN108510067B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张犁;黄蓉;陈治宇;赵博然;牛毅;石光明 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 工程 实现 卷积 神经网络 量化 方法 | ||
1.一种基于工程化实现的卷积神经网络量化方法,包括:
(1)从互联网下载两个已经预训练好的浮点格式卷积神经网络模型;
(2)根据硬件平台处理器的位宽在(1)下载的预训练浮点模型的每一层卷积层和全连接层后面都添加一层自定义的量化层,并用该自定义的量化层对浮点形式的输入数据进行量化,量化的公式为:
其中,Convert表示将浮点输入数据转化为定点输入数据,x为浮点输入数据,IL和FL分别表示定点输入数据的整数位宽和小数位宽,round为四舍五入函数,是编程语言的内置函数,2FL表示量化成小数位宽为FL的定点数,-2IL-1表示定点输入数据表示的数值范围的下限,2IL-1-2-FL表示定点输入数据表示的数值范围的上限;
(3)根据硬件平台处理器的位宽对(1)下载的预训练浮点模型中已经训练好的浮点权值进行量化,量化的公式为:
其中,Convert表示将浮点权值转化为定点权值,w为浮点权值,IL′和FL′分别表示定点权值的整数位宽和小数位宽,round为四舍五入函数,是编程语言的内置函数,2FL′表示量化成小数位宽为FL′的定点数,-2IL′-1表示定点权值表示的数值范围的下限,2IL′-1-2-FL′表示定点权值表示的数值范围的上限。
2.根据权利要求1所述的方法,其中步骤(2)中在步骤(1)下载的预训练浮点模型的每一层卷积层和全连接层后面都添加一层自定义的量化层,是利用编程语言python完成的,其步骤如下:
(2a)定义一个量化层,量化层对浮点输入数据进行量化,量化的定点数位宽用1+IL+FL表示,其中IL表示整数位宽,FL表示小数位宽;
(2b)在步骤(1)下载的预训练浮点网络的每一层卷积层和全连接层后面调用(2a)定义的量化层,用于网络的前向传播。
3.根据权利要求1所述的方法,其中步骤(1)从互联网下载两个已经预训练好的浮点格式卷积神经网络模型,包括:
由3层卷积层和2层全连接层组成的小型网络模型,
由13层卷积层和3层全连接层组成的大型网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810319586.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应用于卷积神经网络的处理器
- 下一篇:一种超深度回归分析学习方法