[发明专利]一种提高模型推断精度的量化方法在审
申请号: | 201911257734.7 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111931922A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 郭敏 | 申请(专利权)人: | 百度(美国)有限责任公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开描述了用于量化训练的神经网络模型的各种实施方式。在一个实施方式中,描述了一种两阶段量化方法。在离线阶段,对于每个层,在每信道的基础上,将该神经网络模型的静态生成的元数据(例如权重和偏差)从浮点数量化成较低位宽的整数。动态生成的元数据(例如,输入特征映射)不在该离线阶段量化。相反,对于每个层,在每信道的基础上,为该动态生成的元数据生成量化模型。这些量化模型和该量化的元数据可以存储在量化元文件中,该量化元文件可以作为该神经网络模型的一部分部署到AI引擎中以便执行。一个或多个特殊编程的硬件部件可以基于该量化元文件中的信息来量化该神经网络模型的每个层。 | ||
搜索关键词: | 一种 提高 模型 推断 精度 量化 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911257734.7/,转载请声明来源钻瓜专利网。