[发明专利]一种模型优化方法、装置、设备及存储介质、程序产品在审
申请号: | 202210171877.1 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114492765A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 叶志凌;孔翰;宋应湃 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 彭奇;王黎延 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 优化 方法 装置 设备 存储 介质 程序 产品 | ||
本申请提供了一种模型优化方法、装置、设备及存储介质、程序产品;本申请实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景,涉及人工智能技术;该方法包括:获取待优化模型和控制参数;通过对待优化模型中的模型算子进行封装,确定待优化模型对应的超模型;其中,超模型的空间结构是动态变化的;依据模型算子和控制参数,确定待优化模型对应的配置搜索空间;模型算子至少包括:待优化模型中的一个网络层;基于配置搜索空间和所述待优化模型,对超模型进行训练,得到待优化模型对应的收敛超模型;从收敛超模型中搜索得到待优化模型对应的优化模型。通过本申请,能够减少模型优化时计算资源的消耗。
技术领域
本申请涉及人工智能技术,尤其涉及一种模型优化方法、装置、设备及存储介质、程序产品。
背景技术
深度学习模型由于其优秀的特征提取、特征泛化能力,经常作为人工智能的核心支撑技术,被应用到各种场景中。为了使得深度学习模型能够具有更好的预测效果或预测效率,通常都会对训练好的深度学习模型进行模型优化,然后再将优化后的深度学习模型部署到应用场景中。然而,相关技术中,模型优化时的可选模型的在生成时需要消耗巨大的计算资源,从而导致模型优化过程存在计算资源消耗大的问题。
发明内容
本申请实施例提供一种模型优化方法、装置、设备及计算机可读存储介质、程序产品,能够减少模型优化时计算资源的消耗。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种模型优化方法,包括:
获取待优化模型和控制参数;所述待优化模型是经过训练的模型;
通过对所述待优化模型中的模型算子进行封装,确定所述待优化模型对应的超模型;其中,所述超模型的空间结构是动态变化的;
依据所述模型算子和所述控制参数,确定所述待优化模型对应的配置搜索空间;所述模型算子至少包括:所述待优化模型中的一个网络层;
基于所述配置搜索空间和所述待优化模型,对所述超模型进行训练,得到所述待优化模型对应的收敛超模型;
从所述收敛超模型中搜索得到所述待优化模型对应的优化模型。
本申请实施例提供一种模型优化装置,包括:
数据获取模块,用于获取待优化模型和控制参数;所述待优化模型是经过训练的模型;
数据封装模块,用于通过对所述待优化模型中的模型算子进行封装,确定所述待优化模型对应的超模型;其中,所述超模型的空间结构是动态变化的;
空间配置模块,用于依据所述模型算子和所述控制参数,确定所述待优化模型对应的配置搜索空间;所述模型算子至少包括:所述待优化模型中的一个网络层;
模型训练模块,用于基于所述配置搜索空间和所述待优化模型,对所述超模型进行训练,得到所述待优化模型对应的收敛超模型;
模型搜索模块,用于从所述收敛超模型中搜索得到所述待优化模型对应的优化模型。
在本申请的一些实施例中,所述数据封装模块,还用于依据所述待优化模型中的模型算子之间的连接关系,将所述待优化模型的所述模型算子划分为多个算子集合;针对每个所述算子集合,确定对应的封装变量;利用所述封装变量对每个所述算子集合中的模型算子进行封装,得到每个所述算子集合的所述模型算子所对应的封装算子;所述封装算子的空间结构是动态的;将利用所述封装算子拼接得到的模型,确定为所述待优化模型对应的所述超模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210171877.1/2.html,转载请声明来源钻瓜专利网。