[发明专利]一种针对模型的调参方法及装置在审
申请号: | 202010307414.4 | 申请日: | 2020-04-17 |
公开(公告)号: | CN113555008A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 朱晓如 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 模型 方法 装置 | ||
本申请公开了一种针对模型的自动调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不包括满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。所述方法可以灵活、快速的实现模型的持续迭代,增加目标模型的准确度。
技术领域
本申请涉及计算机技术领域,具体涉及一种针对模型的调参方法、装置、电子设备及存储设备。本申请同时涉及一种语音识别模型的获得方法、装置、电子设备及存储设备。本申请还涉及一种语音识别方法、装置、电子设备及存储设备。
背景技术
随着深度学习(DL,Deep Learning)技术的不断发展,将训练获得的模型应用于不同的应用场景中,可以较好的方便人们生活。例如,将训练获得的模型应用于语音识别、语义理解、语音合成或者搜索推荐等应用中,可以方便的满足人们的各种需求。
目前在训练模型时,针对模型中的超参数(Hyperparameter),一般是通过人工手动调整超参数的方法来训练获得不同的模型,例如,针对初始的待训练基础模型,一般是由人工设定第一超参数组合信息后,通过训练数据训练获得与第一超参数组合信息对应的目标模型;之后,再由人工设定第二超参数组合信息,并训练获得与第二超参数组合对应的目标模型;如此经过多次手动调整并获得至少一个目标模型之后,从这至少一个目标模型中选取满足性能需求的模型以供使用。当然,目前也有针对模型的自动调参方法,该方法一般是通过计算设备模拟人工调参,即,在获得针对初始基础模型的多个超参数组合信息后,由计算设备串行或并行的获得与不同超参数组合信息对应的至少一个目标模型,并从这至少一个目标模型中选取满足性能需求的模型以供使用。
然而,随着深度学习技术的不断发展,模型的训练通常会占用较多的计算资源,并且单轮训练的耗时也在不断增长,因此,现有技术在对模型进行调参时,通常由于其流程比较固定,存在耗时大量增加的问题,进而导致将训练获得的目标模型或者超参数组合应用到线上时,最新上线的模型的性能效果反而不如线上经过实际数据不断训练获得的模型的效果。由此可知,目前针对模型的自动调参方法存在灵活度低以及准确度相对较低的问题。
发明内容
本申请实施例提供一种针对模型的调参方法,以解决现有技术存在的灵活度低以及准确度低的问题。
本申请实施例提供一种针对模型的调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
可选的,还包括:获得与所述第一目标模型对应的第一性能信息;根据所述第一性能信息,判断所述第一目标模型中是否存在满足所述预设性能条件的目标模型。
可选的,所述根据所述第一性能信息,判断所述第一目标模型中是否包括满足所述预设性能条件的所述目标模型,包括:如果所述第一性能信息中存在不小于预设性能阈值的性能信息,则判定所述第一目标模型中存在所述目标模型。
可选的,还包括:根据所述第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型,获得所述目标模型。
可选的,所述根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,包括:从所述原始超参数组合信息中,获得所述第二超参数组合信息,其中,所述第二超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一目标模型中,选取满足预设模型筛选条件的模型;根据所述满足预设模型筛选条件的模型,获得所述第二待训练基础模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010307414.4/2.html,转载请声明来源钻瓜专利网。