[发明专利]数据处理方法、装置、设备以及存储介质在审

申请号：	202310094738.8	申请日：	2023-01-18
公开（公告）号：	CN116167427A	公开（公告）日：	2023-05-26
发明（设计）人：	徐畅;于广华;王豪爽;党青青;刘其文;马艳军	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06N3/08	分类号：	G06N3/08;G06N3/045;G06N3/0464
代理公司：	北京易光知识产权代理有限公司 11596	代理人：	阎敏;王姗姗
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法装置设备以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了数据处理方法、装置、设备以及存储介质，涉及人工智能领域，尤其涉及深度学习、模型量化技术领域。具体实现方案为：获取待量化网络模型的目标类神经网络层的待量化信息；确定待量化信息的数值分布；在基于待量化信息的数值分布确定待量化信息适合量化、且待量化信息在模拟量化后导致精度损失大于损失阈值的情况下，确定对待量化网络模型的量化过程中目标类神经网络层的待量化信息不执行量化操作。本公开实施例不仅降低模型量化的工作量，提高模型量化的效率，降低对硬件的需求。同时，将不适合被量化的目标类神经网络层跳过量化过程，保留了该类神经网络层的精度，也可提高量化后模型的精度。

技术领域

本公开涉及人工智能领域，尤其涉及深度学习、模型量化技术领域。

背景技术

模型量化技术将神经网络模型的权重和激活值从高精度转化成低精度，可以有效的将模型轻量化。但是使用模型量化可能使得模型的精度下降。尽管学术界提出了大量的量化算法来提高模型精度，但这些算法并不能在所有任务、所有模型上达到相似的效果，实际使用中可能需要大量尝试不同的量化算法，调参方式等才能达到目标量化精度。

发明内容

本公开提供了一种用于数据处理的方法、装置、设备以及存储介质。

根据本公开的一方面，提供了一种数据处理方法，包括：

获取待量化网络模型的目标类神经网络层的待量化信息；

确定待量化信息的数值分布；

在基于待量化信息的数值分布确定待量化信息适合量化、且待量化信息在模拟量化后导致精度损失大于损失阈值的情况下，确定对待量化网络模型的量化过程中目标类神经网络层的待量化信息不执行量化操作。

根据本公开的另一方面，提供了一种数据处理装置，包括：

获取模块，用于获取待量化网络模型的目标类神经网络层的待量化信息；

数值分布确定模块，用于确定待量化信息的数值分布；

量化确定模块，用于在基于待量化信息的数值分布确定待量化信息适合量化、且待量化信息在模拟量化后导致精度损失大于损失阈值的情况下，确定对待量化网络模型的量化过程中目标类神经网络层的待量化信息不执行量化操作。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及