[发明专利]一种数据处理的方法、系统、设备及可读存储介质有效
申请号: | 202010745395.3 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111898751B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 梁玲燕;董刚;赵雅倩 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王晓坤 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 设备 可读 存储 介质 | ||
1.一种数据处理的方法,其特征在于,包括:
根据获取的网络模型的结构信息将所述网络模型的每一层标记为关键层或非关键层;
根据需要部署的硬件资源信息分别确定所述关键层的量化位宽范围和所述非关键层的量化位宽范围;
在所述量化位宽范围内确定所述网络模型每一层的最优量化位宽;
基于所述网络模型每一层的最优量化位宽对所述网络模型进行训练得到最优网络模型,并利用所述最优网络模型进行数据处理;
在所述量化位宽范围内确定所述网络模型每一层的最优量化位宽,包括:
根据所述量化位宽范围内量化位宽的数量确定所述网络模型当前层的训练分支的数量;
为所述网络模型当前层的不同训练分支中的权重设置不同的第一量化位宽,并为所述网络模型当前层的不同训练分支中的特征输入设置不同的第二量化位宽;
根据所述第一量化位宽将所述权重映射为权重值,并根据所述第二量化位宽将所述特征输入映射为特征输入值;
令每一所述训练分支中的所述权重值和所述特征输入值进行卷积计算,并根据得到的卷积运算结果对所述训练分支的重要度评估参数进行更新;
确定所述重要度评估参数最高的训练分支的第一量化位宽和第二量化位宽为所述网络模型当前层的最优量化位宽。
2.根据权利要求1所述的方法,其特征在于,根据获取的网络模型的结构信息将所述网络模型的每一层标记为关键层或非关键层,包括:
根据所述网络模型的结构信息确定初始网络模型参数,并对所述网络模型的每一层进行排序;
将所述网络模型的第一层标记为所述关键层,并根据所述初始网络模型参数计算所述网络模型中当前层与上一层的特征图之间的相似度;
若所述相似度小于阈值,则将所述当前层标记为所述关键层;
若所述相似度大于或等于所述阈值,则将所述当前层标记为所述非关键层。
3.根据权利要求1所述的方法,其特征在于,所述关键层的量化位宽范围大于所述非关键层的量化位宽范围。
4.根据权利要求1所述的方法,其特征在于,所述网络模型包括图像分类模型、图像检测模型、图像识别模型、自然语言处理模型中的至少一项。
5.一种数据处理的系统,其特征在于,包括:
标记模块,用于根据获取的网络模型的结构信息将所述网络模型的每一层标记为关键层或非关键层;
第一确定模块,用于根据需要部署的硬件资源信息分别确定所述关键层的量化位宽范围和所述非关键层的量化位宽范围;
第二确定模块,用于在所述量化位宽范围内确定所述网络模型每一层的最优量化位宽;
数据处理模块,用于基于所述网络模型每一层的最优量化位宽对所述网络模型进行训练得到最优网络模型,并利用所述最优网络模型进行数据处理;
所述第二确定模块包括:
第一确定子模块,用于根据所述量化位宽范围内量化位宽的数量确定所述网络模型当前层的训练分支的数量;
设置子模块,用于为所述网络模型当前层的不同训练分支中的权重设置不同的第一量化位宽,并为所述网络模型当前层的不同训练分支中的特征输入设置不同的第二量化位宽;
映射子模块,用于根据所述第一量化位宽将所述权重映射为权重值,并根据所述第二量化位宽将所述特征输入映射为特征输入值;
更新子模块,用于令每一所述训练分支中的所述权重值和所述特征输入值进行卷积计算,并根据得到的卷积运算结果对所述训练分支的重要度评估参数进行更新;
第二确定子模块,用于确定所述重要度评估参数最高的训练分支的第一量化位宽和第二量化位宽为所述网络模型当前层的最优量化位宽。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010745395.3/1.html,转载请声明来源钻瓜专利网。