[发明专利]一种深度学习模型的训练方法、计算设备以及系统有效
申请号: | 201810104670.6 | 申请日: | 2018-02-02 |
公开(公告)号: | CN110135573B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 王思宇;孟晨;宋楷 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06F40/58 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 党晓林;李辉 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种深度学习模型的训练方法、训练系统、计算设备以及计算机可读存储介质,涉及数据处理技术领域。所述训练方法包括:获取深度学习模型的模型参数;基于训练数据,使用模型参数对深度学习模型进行多次训练,将多次训练生成的模型梯度依次进行累加,确定出累加梯度数据,所述多次训练中的每一次均为有向无环图,且所述多次训练构成有向有环图;输出所述累加梯度数据,以根据所述累加梯度数据更新所述模型参数。本申请的技术方案,由于在多次训练的过程中减少了工作服务器与参数服务器之间的通信次数,因此能够加快深度学习模型的训练速度,获得更好的加速和收敛效果。 | ||
搜索关键词: | 一种 深度 学习 模型 训练 方法 计算 设备 以及 系统 | ||
【主权项】:
1.一种深度学习模型的训练方法,其特征在于,包括:获取深度学习模型的模型参数;基于训练数据,使用模型参数对深度学习模型进行多次训练,将多次训练生成的模型梯度依次进行累加,确定出累加梯度数据,所述多次训练中的每一次均为有向无环图,且所述多次训练构成有向有环图;输出所述累加梯度数据,以根据所述累加梯度数据更新所述模型参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810104670.6/,转载请声明来源钻瓜专利网。