[发明专利]利用模型进行数据处理的方法及相关系统、存储介质有效
申请号: | 202110597246.1 | 申请日: | 2021-05-29 |
公开(公告)号: | CN113407820B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 黎彧君;黄译旻;李震国 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F18/214;G06N3/02 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 模型 进行 数据处理 方法 相关 系统 存储 介质 | ||
本申请实施例提供一种模型训练方法及相关系统、存储介质。其应用于人工智能方面,该方法包括:根据M个模型Psubgt;i‑2/subgt;’中每个模型在第i‑1个训练阶段中每次训练流程得到的模型性能得分、M个模型Psubgt;i‑2/subgt;’中每个模型在所述第i‑1个训练阶段中的超参数、第i个训练阶段的训练流程次数Tsubgt;i/subgt;确定参考超参数,根据M个模型Psubgt;i‑1/subgt;的模型性能得分和参考超参数确定M个模型Psubgt;i‑1/subgt;’中每个模型在第i个训练阶段中的超参数;在第i个训练阶段中,根据M个模型Psubgt;i‑1/subgt;’中每个模型的超参数对每个模型进行Tsubgt;i/subgt;次训练流程,得到M个模型Psubgt;i/subgt;;当第i个训练阶段为最后一个训练阶段时,从M个模型Psubgt;i/subgt;中确定出目标模型。本方案可提高模型计算效率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种模型训练方法及相关系统、存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。
神经网络已经成功应用于多个领域,包括计算机视觉,机器翻译,语音识别等等。成功训练一个神经网络,往往需要调节合适的超参数。其中,超参数是在开始训练深度神经网络之前设置的参数,不是神经网络的网络权重参数,而是用于控制训练过程中的参数。超参数并不直接参与到训练的过程中,它们只是配置变量。
合适的超参数对于训练得到的神经网络的性能有一定的影响。因此,如何自动化超参数选择过程也是一个具有商业价值的技术。
目前,基于种群的老虎机bandit算法(Population-Based Bandit,PB2)将训练过程拆分成若干个训练阶段。每个训练阶段包含多次训练流程。对于每一次训练流程,模型遍历一遍样本集。在挑选超参数时,PB2根据下一个训练阶段中第一次训练流程得到的模型性能估计进行超参数挑选。然而,由于其只能预测下一个训练阶段中进行第一次训练流程得到的模型性能,预测目标过于限定,其对于神经网络的下一个训练阶段的最后一次训练流程得到的模型性能无法预测。由于挑选合适的超参数时更关注每个训练阶段的最后一次训练流程得到的模型性能,因此,该方法对于获得性能较好的神经网络的指导意义不大。
发明内容
本申请公开了一种模型训练方法及相关系统、存储介质,可以有助于提高模型计算效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597246.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:跟驰换乘公交车的地面单向环路
- 下一篇:一种配电网建设目标风险评估方法