[发明专利]一种模型训练方法、装置、设备、系统及存储介质在审
申请号: | 201911048084.5 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110766090A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 欧阳显斌;周飞虎;魏杰乾 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 44285 深圳市深佳知识产权代理事务所(普通合伙) | 代理人: | 王兆林 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练阶段 模型训练 最优模型 初始模型 迭代更新 模型网络 训练效果 综合性能 递进 整合 优化 搜索 阶层 评估 申请 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
确定模型对应的多个连续训练阶段,不同的训练阶段用于在模型训练过程中同步优化不同的超参数;
在所述多个连续训练阶段的当前训练阶段中,根据所述当前训练阶段中待优化的超参数对应的超参数搜索范围进行超参数优化搜索,获得当前训练阶段训练所得的最优模型作为当前训练阶段最优模型;
将所述当前训练阶段最优模型作为下一训练阶段的初始模型,根据所述下一训练阶段中待优化的超参数对应的超参数搜索范围进行超参数优化搜索,获得所述下一训练阶段训练所得的最优模型作为所述下一训练阶段最优模型,直到获得在所述多个连续训练阶段中的最后一个训练阶段训练所得的最优模型。
2.根据权利要求1所述的方法,其特征在于,所述确定模型对应的多个连续训练阶段,包括:
确定超参数能力杂交次数N和第i次杂交涉及的超参数对应的超参数搜索范围,所述N为大于1的整数,所述i取值为1至N中的所有正整数;
针对模型训练设置所述N个连续的训练阶段,其中,第i个训练阶段用于对第i次杂交涉及的超参数进行优化。
3.根据权利要求1所述的方法,其特征在于,所述进行超参数优化搜索,包括:通过随机超参数优化算法在超参数搜索范围内按照预设的搜索次数进行随机超参数优化搜索。
4.根据权利要求1所述的方法,其特征在于,所述获得当前训练阶段训练所得的最优模型,包括:
当所述当前训练阶段内的训练步数达到预设步数时,获取所述当前训练阶段内进行超参数优化搜索后训练所得的多个中间模型;
从所述多个中间模型中选择模型性能满足预设条件且性能最优的一个中间模型,将选择出的中间模型作为所述当前训练阶段训练所得的最优模型。
5.根据权利要求1所述的方法,其特征在于,当所述多个中间模型的性能均不满足预设条件时,所述方法还包括:
将上一训练阶段训练所得的次优模型作为所述当前训练模型的初始模型,返回重复执行所述步骤:所述根据所述当前训练阶段中待优化的超参数对应的超参数搜索范围进行超参数优化搜索,获得所述当前训练阶段训练所得的最优模型作为所述当前训练阶段最优模型。
6.根据权利要求1所述的方法,其特征在于,所述多个连续的训练阶段中至少有一个训练阶段用于对一种超参数进行优化,且,至少有另一个训练阶段用于对多种超参数进行同步优化。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述模型为游戏智能体的对战决策模型,所述对战决策模型用于根据当前状态决策出游戏智能体下一动作。
8.一种模型训练装置,其特征在于,所述装置包括:
确定模块,用于确定模型对应的多个连续训练阶段,不同的训练阶段用于在模型训练过程中同步优化不同的超参数;
第一训练模块,用于在所述多个连续训练阶段的当前训练阶段中,根据所述当前训练阶段中待优化的超参数对应的超参数搜索范围进行超参数优化搜索,获得当前训练阶段训练所得的最优模型作为当前训练阶段最优模型;
第二训练模块,用于将所述当前训练阶段最优模型作为下一训练阶段的初始模型,根据所述下一训练阶段中待优化的超参数对应的超参数搜索范围进行超参数优化搜索,获得所述下一训练阶段训练所得的最优模型作为所述下一训练阶段最优模型,直到获得在所述多个连续训练阶段中的最后一个训练阶段训练所得的最优模型。
9.一种设备,其特征在于,包括:
存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于运行所述计算机程序以执行上述权利要求1至8中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911048084.5/1.html,转载请声明来源钻瓜专利网。