[发明专利]一种基于卷积神经网络模型的数据处理方法及装置有效
申请号: | 201710816734.0 | 申请日: | 2017-09-12 |
公开(公告)号: | CN107395211B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 谢启凯;吴韶华 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G06N3/04;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李丹 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 模型 数据处理 方法 装置 | ||
1.一种基于卷积神经网络模型的数据处理方法,其特征在于,包括以下步骤:
通过对卷积神经网络模型中卷积层和/或全连接层的参数数据进行循环训练,获得预设格式离散数据;
采用预设位数比特位对所述预设格式离散数据进行存储,
所述预设格式离散数据为:2的整次幂数据,或者2的整次幂数据与0数据。
2.根据权利要求1所述的数据处理方法,其特征在于,所述参数数据的格式为:FP32格式即浮点数32位存储格式。
3.根据权利要求1所述的数据处理方法,其特征在于,将所述参数数据转换为2的整次幂的离散数据过程为:
其中,W为参数数据值,E为离散数据值,floor()函数表示对数值向下取整,sgn()函数的定义如下:
4.根据权利要求1所述的数据处理方法,其特征在于,根据比特位的位数,确定2的幂指数的范围。
5.根据权利要求4所述的数据处理方法,其特征在于,所述比特位的位数为4。
6.根据权利要求1所述的数据处理方法,其特征在于,所述通过对卷积神经网络模型中卷积层和/或全连接层的参数数据进行循环训练,获得预设格式离散数据之前,还包括:
对所述卷积神经网络模型中卷积层和/或全连接层的参数数据的转换比例进行设定,获取设定结果。
7.根据权利要求6所述的数据处理方法,其特征在于,所述设定结果包括所述卷积神经网络模型中离散数据的初始比例;每一次训练完成后,所述卷积神经网络模型中离散数据的目标比例。
8.根据权利要求7所述的数据处理方法,其特征在于,若所述初始比例为p1、所述目标比例p2,则将M个参数数据转换为所述预设格式离散数据;其中,M=(p2-p1)×N,0≤p1p2≤100%,N为参数数据总个数。
9.根据权利要求8所述的数据处理方法,其特征在于,所述M个参数数据均大于或等于预设目标值。
10.一种基于卷积神经网络模型的数据处理装置,其特征在于,包括处理器,适于实现各指令;存储设备,适于存储多条指令,所述指令适于由所述处理器加载并执行;
通过对卷积神经网络模型中卷积层和/或全连接层的参数数据进行循环训练,获得预设格式离散数据;
采用预设位数比特位对所述预设格式离散数据进行存储,
所述预设格式离散数据为:2的整次幂数据,或者2的整次幂数据与0数据。
11.根据权利要求10所述的数据处理装置,其特征在于,所述参数数据的格式为:FP32格式即浮点数32位存储格式。
12.根据权利要求10所述的数据处理装置,其特征在于,将所述参数数据转换为2的整次幂的离散数据过程为:
其中,W为参数数据值,E为离散数据值,floor()函数表示对数值向下取整,sgn()函数的定义如下:
13.根据权利要求10所述的数据处理装置,其特征在于,根据比特位的位数,确定2的幂指数的范围。
14.根据权利要求13所述的数据处理装置,其特征在于,所述比特位的位数为4。
15.根据权利要求10所述的数据处理装置,其特征在于,所述通过对卷积神经网络模型中卷积层和/或全连接层的参数数据进行循环训练,获得预设格式离散数据之前,还包括:
对所述卷积神经网络模型中卷积层和/或全连接层的参数数据的转换比例进行设定,获取设定结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710816734.0/1.html,转载请声明来源钻瓜专利网。