[发明专利]用于处理数据的方法、设备和计算机程序产品在审
申请号: | 201910713771.8 | 申请日: | 2019-08-02 |
公开(公告)号: | CN112308233A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 胡晨曦;李三平 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;姚杰 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 数据 方法 设备 计算机 程序 产品 | ||
本公开的实施例涉及用于处理数据的方法、设备和计算机程序产品。该方法包括在第一计算设备处,生成与机器学习模型的节点处理的数据块相关联的第一组梯度值,第一组梯度值具有第一数据格式。该方法还包括从第一组梯度值确定第一共享因子,第一共享因子具有第二数据格式,第二数据格式的精度低于第一数据格式。该方法还包括利用第一共享因子对第一组梯度值进行缩放,以得到具有第二数据格式的第二组梯度值。该方法还包括向第二计算设备发送第二组梯度值和第一共享因子。该方法还包括响应于接收到来自第二计算设备的第三组梯度值和第二共享因子,调整机器学习模型的参数。通过使用该方法,可以减少数据的传输量,提高计算网络模型的效率。
技术领域
本公开的实施例总体涉及数据处理,更具体地,涉及在机器学习模型中处理数据的方法、设备和计算机程序产品。
背景技术
目前,随着计算机技术的发展,越来越多的任务通过机器学习模型来处理。在机器学习模型中,一般先用样本数据对机器学习模型进行训练。在利用样本数据的训练机器模型时,通过调整机器学习模型的参数,来使得机器学习模型的训练结果收敛。然后再用训练好的模型来处理数据。
然而,随着机器学习模型的发展,需要将机器学习模型部署到不同的设备上以执行数据并行或模型并行。现在深度学习模型随着参数增多变得更加复杂。通过分布式深度学习可以减少模型训练时间。随着GPU集群规模的扩大,通过分布式GPU的并行计算,可以实现更高的训练速度。然而,在机器学习模型的并行执行过程中还存在着许多问题。
发明内容
本公开的实施例提供一种用于处理数据的方法、设备和计算机程序产品。
根据本公开的第一方面,提供了一种用于处理数据的方法。该方法包括在第一计算设备处,生成与机器学习模型的节点处理的数据块相关联的第一组梯度值,第一组梯度值具有第一数据格式。该方法还包括从第一组梯度值确定第一共享因子,第一共享因子具有第二数据格式,第二数据格式的精度低于第一数据格式。该方法还包括利用第一共享因子对第一组梯度值进行缩放,以得到具有第二数据格式的第二组梯度值。该方法还包括向第二计算设备发送第二组梯度值和第一共享因子。该方法还包括响应于接收到来自第二计算设备的第三组梯度值和第二共享因子,调整机器学习模型的参数。
根据本公开的第二方面,提供了一种用于处理数据的方法。该方法包括在第二计算设备处,从第一计算设备接收第二组梯度值和第一共享因子,第二组梯度值是利用第一共享因子对与机器学习模型的节点处理的数据块相关联的第一组梯度值进行缩放而得到的。该方法还包括获取第三设备的针对数据块的第四组梯度值和与第四组梯度值有关的第三共享因子,第三设备运行机器学习模型。该方法还包括基于第一共享因子、第二组梯度值、第四组梯度值和第三共享因子来确定第三组梯度值和针对第三组梯度值的第二共享因子。该方法还包括向第一计算设备发送第三组梯度值和第二共享因子以使得第一计算设备用于调整机器学习模型的参数。
根据本公开的第三方面,提供了一种用于处理数据的电子设备。该电子设备包括处理器;以及存储器,存储有计算机程序指令,处理器运行存储器中的计算机程序指令控制电子设备执行动作,动作包括:生成与机器学习模型的节点处理的数据块相关联的第一组梯度值,第一组梯度值具有第一数据格式;从第一组梯度值确定第一共享因子,第一共享因子具有第二数据格式,第二数据格式的精度低于第一数据格式;利用第一共享因子对第一组梯度值进行缩放,以得到具有第二数据格式的第二组梯度值;向第二计算设备发送第二组梯度值和第一共享因子;以及响应于接收到来自第二计算设备的第三组梯度值和第二共享因子,调整机器学习模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910713771.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务异步交互方法及装置
- 下一篇:一种业务传输方法、装置及计算机可读存储介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置