[发明专利]数据处理方法、装置、计算机设备和存储介质有效
申请号: | 201911175116.8 | 申请日: | 2019-11-26 |
公开(公告)号: | CN110889503B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/02 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种神经网络的数据量化处理方法,其特征在于,应用于处理器,所述方法包括:
获取神经网络中待量化层的状态数据;
利用预先训练好的强化学习模型,对所述状态数据进行处理,得到所述待量化层的量化位宽,以根据所述量化位宽对所述待量化层中对应的待量化数据进行量化,所述强化学习模型包括第一子模型和第二子模型,所述第一子模型用于对所述状态数据进行处理,得到所述待量化层的量化位宽,
其中,所述状态数据包括:所述待量化层在神经网络中对应的层数、所述神经网络中所述待量化层的上一层的量化位宽、所述待量化层对应的运算类型、与所述运算类型相对应的运算参数、所述待量化层的输入数据和/或输出数据的数据参数;
针对所述强化学习模型的训练过程,所述训练过程包括:
获取训练好的神经网络中当前层的状态数据;
将所述当前层的状态数据输入待训练强化学习模型中的待训练第一子模型,得到所述当前层的量化位宽;
根据所述当前层的量化位宽对所述训练好的神经网络中的待量化数据进行量化,得到量化后神经网络,并确定所述量化后神经网络的模型准确率;
根据所述模型准确率、所有层中待量化数据的数据规模和所有层的量化位宽,得到对应于待训练强化学习模型的奖励函数;
以所述奖励函数、模型准确率、所述当前层的状态数据和所述当前层的下一层的状态数据为样本,对待训练强化学习模型进行训练;
在训练得到的强化学习模型满足停止训练条件时,停止训练,得到训练好的强化学习模型;
所述在训练得到的强化学习模型满足停止训练条件时,停止训练,得到训练好的强化学习模型,包括:
利用所述第二子模型,对所述当前层的状态数据和所述当前层的量化位宽进行处理,得到对应所述当前层的量化位宽的评价,并根据所述评价得到所述第一子模型的第一损失函数;
根据所述奖励函数、当前层的第一损失函数以及下一层的第一损失函数,得到所述第二子模型的第二损失函数;
在所述第一子模型的第一损失函数和所述第二损失函数的变化率小于或等于对应的变化率阈值时,停止训练,得到训练好的强化学习模型。
2.根据权利要求1所述的方法,其特征在于,所述数据参数包括数据高度、数据宽度、通道数中的至少一种,所述运算类型包括卷积运算和全连接运算中的任一种,
其中,在所述运算类型为卷积运算时,与所述卷积运算相对应的运算参数包括卷积核尺寸、滑动步长。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计待量化数据,确定每种待量化数据的统计结果;
利用每种待量化数据的统计结果以及所述量化位宽确定对应的量化参数,所述量化参数用于在神经网络运算过程中对所述待量化数据进行对应量化,
其中,所述量化参数包括点位置参数、缩放系数和偏移量中的至少一种,
所述待量化数据包括神经网络的神经元、权值、梯度、偏置中的至少一种数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911175116.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有压实功能的纱线用工作台
- 下一篇:一种锂电池的检测装置