[发明专利]用于处理数据的方法、设备和计算机程序产品在审

专利信息
申请号: 201910713771.8 申请日: 2019-08-02
公开(公告)号: CN112308233A 公开(公告)日: 2021-02-02
发明(设计)人: 胡晨曦;李三平 申请(专利权)人: 伊姆西IP控股有限责任公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华;姚杰
地址: 美国马*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 处理 数据 方法 设备 计算机 程序 产品
【说明书】:

本公开的实施例涉及用于处理数据的方法、设备和计算机程序产品。该方法包括在第一计算设备处,生成与机器学习模型的节点处理的数据块相关联的第一组梯度值,第一组梯度值具有第一数据格式。该方法还包括从第一组梯度值确定第一共享因子,第一共享因子具有第二数据格式,第二数据格式的精度低于第一数据格式。该方法还包括利用第一共享因子对第一组梯度值进行缩放,以得到具有第二数据格式的第二组梯度值。该方法还包括向第二计算设备发送第二组梯度值和第一共享因子。该方法还包括响应于接收到来自第二计算设备的第三组梯度值和第二共享因子,调整机器学习模型的参数。通过使用该方法,可以减少数据的传输量,提高计算网络模型的效率。

技术领域

本公开的实施例总体涉及数据处理,更具体地,涉及在机器学习模型中处理数据的方法、设备和计算机程序产品。

背景技术

目前,随着计算机技术的发展,越来越多的任务通过机器学习模型来处理。在机器学习模型中,一般先用样本数据对机器学习模型进行训练。在利用样本数据的训练机器模型时,通过调整机器学习模型的参数,来使得机器学习模型的训练结果收敛。然后再用训练好的模型来处理数据。

然而,随着机器学习模型的发展,需要将机器学习模型部署到不同的设备上以执行数据并行或模型并行。现在深度学习模型随着参数增多变得更加复杂。通过分布式深度学习可以减少模型训练时间。随着GPU集群规模的扩大,通过分布式GPU的并行计算,可以实现更高的训练速度。然而,在机器学习模型的并行执行过程中还存在着许多问题。

发明内容

本公开的实施例提供一种用于处理数据的方法、设备和计算机程序产品。

根据本公开的第一方面,提供了一种用于处理数据的方法。该方法包括在第一计算设备处,生成与机器学习模型的节点处理的数据块相关联的第一组梯度值,第一组梯度值具有第一数据格式。该方法还包括从第一组梯度值确定第一共享因子,第一共享因子具有第二数据格式,第二数据格式的精度低于第一数据格式。该方法还包括利用第一共享因子对第一组梯度值进行缩放,以得到具有第二数据格式的第二组梯度值。该方法还包括向第二计算设备发送第二组梯度值和第一共享因子。该方法还包括响应于接收到来自第二计算设备的第三组梯度值和第二共享因子,调整机器学习模型的参数。

根据本公开的第二方面,提供了一种用于处理数据的方法。该方法包括在第二计算设备处,从第一计算设备接收第二组梯度值和第一共享因子,第二组梯度值是利用第一共享因子对与机器学习模型的节点处理的数据块相关联的第一组梯度值进行缩放而得到的。该方法还包括获取第三设备的针对数据块的第四组梯度值和与第四组梯度值有关的第三共享因子,第三设备运行机器学习模型。该方法还包括基于第一共享因子、第二组梯度值、第四组梯度值和第三共享因子来确定第三组梯度值和针对第三组梯度值的第二共享因子。该方法还包括向第一计算设备发送第三组梯度值和第二共享因子以使得第一计算设备用于调整机器学习模型的参数。

根据本公开的第三方面,提供了一种用于处理数据的电子设备。该电子设备包括处理器;以及存储器,存储有计算机程序指令,处理器运行存储器中的计算机程序指令控制电子设备执行动作,动作包括:生成与机器学习模型的节点处理的数据块相关联的第一组梯度值,第一组梯度值具有第一数据格式;从第一组梯度值确定第一共享因子,第一共享因子具有第二数据格式,第二数据格式的精度低于第一数据格式;利用第一共享因子对第一组梯度值进行缩放,以得到具有第二数据格式的第二组梯度值;向第二计算设备发送第二组梯度值和第一共享因子;以及响应于接收到来自第二计算设备的第三组梯度值和第二共享因子,调整机器学习模型的参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910713771.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top