[发明专利]模型训练方法、系统、芯片、电子设备及介质在审
申请号: | 202010064764.2 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111191789A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 王益县;章子誉 | 申请(专利权)人: | 上海依图网络科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 唐嘉伟 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 系统 芯片 电子设备 介质 | ||
1.一种模型训练方法,其特征在于包括:
S1,在预设的基础神经网络上训练一组模型,选出在验证集上性能最好的模型T0;
S2,在T0上进行优化获得若干备选实验配置,对所述若干备选实验配置训练并获得其中性能最优的模型T1’;
S3,对T1’重新训练,确保重新训练的性能结果的平均值大于T0的性能,得到最优的模型配置。
2.根据权利要求1所述的模型训练方法,其特征在于:S2中,所述在T0上进行优化的方法为调整参数。
3.根据权利要求2所述的模型训练方法,其特征在于:所述参数包括以下之一或组合:模型宽度,学习速率,优化策略,是否使用数据增强,数据增强的参数,网络单位模块。
4.根据权利要求1-3任一所述的模型训练方法,其特征在于:S3对T1’的重新训练中,如果重新训练的性能结果大于T0的性能结果,则替代T0作为新的备选实验配置。
5.根据权利要求4所述的模型训练方法,其特征在于:所述迭代优化的过程反复循环进行,直至性能最优时停止。
6.一种模型优化部署系统,其特征在于,包括:
数据预处理模块,接受回流数据,然后输出经过预处理的数据集;
模型训练模块,对数据集执行权利要求1-6中任一所述的模型训练方法,得到最优配置模型;
模型部署模块,根据待部署的硬件的环境对最优配置模型进行适配并转换,最终部署于所述硬件。
7.根据权利要求6所述的模型优化部署系统,其特征在于:还包括数据标注模块,对辅助进行数据标注。
8.一种芯片,其特征在于,包括处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行权利要求1-5中任一项所述的模型训练方法。
9.一种电子设备,其特征在于:包括处理器、以及用于存储处理器的可执行指令的存储器,所述处理器运行时执行权利要求1-5中任一所述的模型训练方法。
10.一种计算机可读介质,其特征在于:所述计算机可读存储介质上存储有计算机程序,所述计算机程序指令被处理执行时,实现权利要求1-5中任一所述的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司,未经上海依图网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010064764.2/1.html,转载请声明来源钻瓜专利网。