[发明专利]用于确定模型压缩率的方法、设备和程序产品在审
申请号: | 202010125822.8 | 申请日: | 2020-02-27 |
公开(公告)号: | CN113313246A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 杨文彬;刘金鹏;王汇泽;李三平;贾真 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 罗利娜 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 模型 压缩率 方法 设备 程序 产品 | ||
本公开的实施例提供用于确定模型压缩率的方法、设备和程序产品。一种用于确定模型压缩率的方法包括从与机器学习模型相关联的重要性值集合确定近零重要性值子集,重要性值集合中的相应重要性值指示机器学习模型的处理层的相应输入的重要程度,近零重要性值子集中的重要性值相比于重要性值集合中的其他重要性值更接近零;从近零重要性值子集中确定目标重要性值,目标重要性值对应于近零重要性值子集中重要性值幅度的转折点;确定重要性值集合中低于目标重要性值的重要性值占重要性值集合的比例;以及基于所确定的比例来确定用于机器学习模型的压缩率。根据该方案,不需要进行非常耗时的训练过程就可以提前获知在不损失模型性能前提下的最佳压缩率。
技术领域
本公开的实施例涉及人工智能领域,并且更具体地,涉及用于确定模型压缩率的方法、电子设备和计算机程序产品。
背景技术
人工智能技术近年来不断得到发展并且当前已经被广泛用于不同领域和实现中。机器学习模型可以被设计用于实现各种各样的人工智能任务,包括计算机视觉处理、语音识别、自然语言处理等。已训练的机器学习模型有时候需要被部署到具有处理和/或存储能力有限的设备中,诸如终端设备、边缘计算设备。机器学习模型的执行,特别是复杂或者被更精密配置的模型的执行将要求较高的处理和存储资源。
发明内容
本公开的实施例提供了一种用于确定模型压缩率的方案。
在本公开的第一方面,提供了一种用于确定模型压缩率的方法。该方法包括从与机器学习模型相关联的重要性值集合确定近零重要性值子集,重要性值集合中的相应重要性值指示机器学习模型的处理层的相应输入的重要程度,近零重要性值子集中的重要性值相比于重要性值集合中的其他重要性值更接近零;从近零重要性值子集中确定目标重要性值,目标重要性值对应于近零重要性值子集中重要性值幅度的转折点;确定重要性值集合中低于目标重要性值的重要性值占重要性值集合的比例;以及基于所确定的比例来确定用于机器学习模型的压缩率。
在本公开的第二方面,提供了一种电子设备。该电子设备包括至少一个处理器;以及存储有计算机程序指令的至少一个存储器,至少一个存储器和计算机程序指令被配置为,与至少一个处理器一起,使得电子设备执行动作。动作包括从与机器学习模型相关联的重要性值集合确定近零重要性值子集,近零重要性值子集中的重要性值相比于重要性值集合中的其他重要性值更接近零;从近零重要性值子集中确定目标重要性值,目标重要性值对应于近零重要性值子集中重要性值幅度的转折点;确定重要性值集合中低于目标重要性值的重要性值占重要性值集合的比例;以及基于所确定的比例来确定用于机器学习模型的压缩率。
在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使设备实现以上第一方面的方法。
提供发明内容部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了本公开实施例可以在其中被实施的环境的示意图;
图2示出了指示模型准确度相对于模型剪枝率的模型剪枝性能曲线;
图3示出了根据本公开的一些实施例的用于确定模型压缩率的信令过程的流程图;
图4示出了根据本公开的一些实施例的机器学习模型的处理层和剪枝后的处理层的示例;
图5A示出了根据本公开的一些实施例的机器学习模型的重要性值集合的分布的示例;
图5B示出了根据本公开的一些实施例的对重要性值执行对数变换后的结果的示例;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010125822.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种凸轮摆动式瓶刷
- 下一篇:指套结构的加工方法及指套结构