[发明专利]一种卷积神经网络量化方法及装置、计算机可读存储介质在审
申请号: | 202010323877.X | 申请日: | 2020-04-22 |
公开(公告)号: | CN111626402A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 高蕾;秦步月;窦勇;姜晶菲;苏华友;李荣春;许金伟 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N5/04 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 卷积 神经网络 量化 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种卷积神经网络量化方法及装置、计算机可读存储介质。该方法包括:在利用卷积神经网络进行推理过程中,获取当前数据集中的所有图像在卷积神经网络各层中的特征值数据;根据特征值数据中的所有特征值所处的数值范围设置定点整数位数,根据定点整数位数确定定点小数位数;测试当前的至少一种定点格式的精度;判断是否存在至少一种定点格式的精度满足设定的精度:如果是,则直接进行量化;如果否,则进行分层量化。装置包括特征获取模块、定点设置模块、精度测试模块、精度比较模块、整体量化模块及分层量化模块。本发明不仅能够保证卷积神经网络输出结果的精度,而且还能够有效地降低量化位宽,降低存储空间和带宽。
技术领域
本发明涉及卷积神经网络技术领域,更为具体来说,本发明为一种卷积神经网络量化方法及装置、计算机可读存储介质。
背景技术
目前,卷积神经网络工作时可采用较高精度的浮点数进行运算,从而能够达到较高的运算精度,特别是在图像关键点检测过程中,高精度运算是必不可少的。但是,在卷积神经网络所有工作过程中均采用高精度浮点数运算会带来很多问题,比如运行时间过长、存储空间和带宽过高、数据位宽大以及运算部件较多等等。
因此,在卷积神经网络工作过程中,如何保证同时具备精度高、存储空间和带宽低等优点,成为了本领域技术人员亟待解决的技术问题和始终研究的重点。
发明内容
为解决现有技术无法使卷积神经网络同时兼顾高精度运算和低存储、低带宽等要求及无法较好地用于图像关键点检测等工作中,本发明提供了一种卷积神经网络量化方法及装置、计算机可读存储介质,创新地提供了卷积神经网络分层量化方案,从而达到既能降低量化位宽又能保持精度的目的,从而彻底解决现有技术存在的至少一个问题。
为实现上述技术目的,本发明公开了一种卷积神经网络量化方法,该方法包括如下步骤:在利用卷积神经网络进行推理过程中,获取当前数据集中的所有图像在卷积神经网络各层中的特征值数据;根据所述特征值数据中的所有特征值所处的数值范围设置定点整数位数,并根据所述定点整数位数确定定点小数位数;测试所述定点整数位数和所述定点小数位数对应的至少一种定点格式的精度;判断是否存在至少一种定点格式的精度满足设定的精度:如果是,则利用具有最高精度的定点格式对所述卷积神经网络进行量化;如果否,则对所述卷积神经网络进行分层量化。
进一步地,对所述卷积神经网络进行分层量化的步骤包括:将所述卷积神经网络中的待量化层中的所有特征值进行从小到大或从大到小排序,以得到特征值集合;利用所述特征值集合中预设区间范围的特征值所处的数值范围确定当前待量化层的定点整数位数和定点小数位数;根据当前待量化层的定点整数位数和定点小数位数确定当前待量化层的至少一种定点格式;利用具有满足设定的精度的定点格式对当前待量化层进行量化,直至所述卷积神经网络中的所有待量化层均分层量化完成。
进一步地,在得到待量化层的特征值集合之后,将所述特征值集合划分为三个子集合:第一集合、第二集合及第三集合,利用第二集合中的特征值所处的数值范围确定当前待量化层的定点整数位数和定点小数位数;其中,第一集合中的任一值≥第二集合中的任一值≥第三集合中的任一值。
进一步地,在对所述特征值集合进行划分时:从所述特征值集合中抽出10%的数据量作为第一集合,从所述特征值集合中抽出80%的数据量作为第二集合,并将剩余的10%的数据量作为第三集合。
进一步地,所述根据定点整数位数确定定点小数位数,包括:根据所述定点整数位数确定量化位宽,利用所述量化位宽、所述定点整数位数及符号位计算所述定点小数位数;其中,所述量化位宽等于所述定点整数位数、所述定点小数位数与所述符号位之和。
进一步地,所述根据特征值数据中的所有特征值所处的数值范围设置定点整数位数,包括:根据所述特征值数据中的所有特征值所处的数值范围确定最大值和最小值,依据所述最大值和所述最小值设置所述定点整数位数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010323877.X/2.html,转载请声明来源钻瓜专利网。