[发明专利]一种深度学习模型训练方法、装置及相关设备在审
申请号: | 202111643825.1 | 申请日: | 2021-12-29 |
公开(公告)号: | CN116432011A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 鲍翔;马婧婷;付烁;宁振江 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N3/0464;G06N3/084 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 罗晓敏 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种深度学习模型训练方法,该深度学习模型包括多个层,并且每层包括至少一个参数,在深度学习模型的第一训练阶段中进行反向计算之后,对多个层的第一层的第一参数进行调整;具体的,确定第一参数的第一调整值,并确定第一调整值是否超出调整上限;在超过调整上限时,将第一调整值修正为第二调整值,该第二调整值小于等于该调整上限,从而根据第二调整值对第一参数进行调整。如此,参数的调整值在每轮迭代时均可以被限制在稳定范围内,这使得即使超参数设置不合适,深度学习模型也会因为参数值的变化稳定而能够收敛。如此可以降低深度学习模型的训练成本、提高训练效率。此外,本申请还提供了对应的装置及相关设备。 | ||
搜索关键词: | 一种 深度 学习 模型 训练 方法 装置 相关 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111643825.1/,转载请声明来源钻瓜专利网。