[发明专利]评估模型性能的方法、装置、计算机设备及可读存储介质在审

专利信息
申请号: 202211284811.X 申请日: 2022-10-20
公开(公告)号: CN115620272A 公开(公告)日: 2023-01-17
发明(设计)人: 林晨;彭博;李哲暘;谭文明;任烨 申请(专利权)人: 杭州海康威视数字技术股份有限公司
主分类号: G06V20/62 分类号: G06V20/62;G06V30/148;G06V30/19;G06F17/11;G06N3/04;G06N3/08
代理公司: 北京天同知创知识产权代理事务所(普通合伙) 16046 代理人: 张岳峰
地址: 310051 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 评估 模型 性能 方法 装置 计算机 设备 可读 存储 介质
【权利要求书】:

1.一种评估模型性能的方法,其特征在于,包括:

获取由多个候选混合精度模型的比特配置,组成的候选比特配置集合,所述比特配置用于对待量化浮点模型的不同层进行量化;

从所述候选比特配置集合中分离出候选比特配置子集,测试并记录所述候选比特配置子集中每个所述比特配置的量化性能,所述量化性能为所述比特配置对应的所述混合精度模型量化所述浮点模型时表现的优劣程度;

根据所述浮点模型的层数,将所述浮点模型划分为多个浮点优化单元,并确定所述候选比特配置集合中所有所述比特配置对应的所述混合精度模型相对多个所述浮点优化单元的输出损失;

根据所述量化性能和所述输出损失,对多个候选的所述混合精度模型的性能进行预测评估。

2.根据权利要求1所述的评估模型性能的方法,其特征在于,所述根据所述量化性能和所述输出损失,对多个候选的所述混合精度模型的性能进行预测评估的步骤包括:

采用线性回归方程,对所述候选比特配置子集中所述比特配置的所述量化性能,和所述候选比特配置子集中所述比特配置对应的所述混合精度模型相对多个所述浮点优化单元的所述输出损失进行线性组合,获得性能预测方程;

根据所述性能预测方程,和所述候选比特配置集合中所有所述比特配置对应的所述混合精度模型相对多个所述浮点优化单元的所述输出损失,预测所有所述比特配置对应的所述混合精度模型量化所述浮点模型时表现的优劣程度。

3.根据权利要求1所述的评估模型性能的方法,其特征在于,所述确定所述候选比特配置集合中所有所述比特配置对应的所述混合精度模型相对多个所述浮点优化单元的输出损失的步骤包括:

将每个所述浮点优化单元中各层的待量化数据,量化为由多个不同精度的比特参数构成的多精度量化单元;

根据所述比特配置和所述多精度量化单元的所述比特参数,确定所述混合精度模型在各个所述浮点优化单元处对应的混合精度优化单元;

获取所述浮点优化单元的预定输出特征值,及所述预定输出特征值对应的输入特征,将所述输入特征输入相应的所述混合精度优化单元,获得真实输出特征值,计算每个所述混合精度优化单元的所述真实输出特征值相对所述预定输出特征值之间的损失。

4.根据权利要求3所述的评估模型性能的方法,其特征在于,所述待量化数据包括浮点模型的权重和/或特征值,则,所述将每个所述浮点优化单元中各层的待量化数据,量化为由多个不同精度的比特参数构成的多精度量化单元的步骤包括:

采用预定的数据取整规则,将所述权重和/或所述特征值量化为由多个不同精度的比特参数构成的多精度量化单元。

5.根据权利要求3所述的评估模型性能的方法,其特征在于,所述方法还包括:

通过重构所述浮点优化单元的所述预定输出特征值,更新所述多精度量化单元中的比特参数。

6.根据权利要求3至4任一所述的评估模型性能的方法,其特征在于,所述待量化数据的数据类型包括:

浮点数或整型数,其中,所述浮点数为小于三十二位浮点数的低精度浮点数,所述整型数为小于三十二位整型数的低精度整型数。

7.一种评估模型性能的装置,其特征在于,包括:

配置获取模块(11),用于获取由多个候选混合精度模型的比特配置,组成的候选比特配置集合,所述比特配置用于对待量化浮点模型的不同层进行量化;

分离测试模块(12),用于从所述候选比特配置集合中分离出候选比特配置子集,测试并记录所述候选比特配置子集中每个所述比特配置的量化性能,所述量化性能为所述比特配置对应的所述混合精度模型量化所述浮点模型时表现的优劣程度;

损失计算模块(13),用于根据所述浮点模型的层数,将所述浮点模型划分为多个浮点优化单元,并确定所述候选比特配置集合中所有所述比特配置对应的所述混合精度模型相对多个所述浮点优化单元的输出损失;

评估模块(14),用于根据所述量化性能和所述输出损失,对多个候选的所述混合精度模型的性能进行预测评估。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211284811.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top