[发明专利]非标量数据的大数据集的约简和广播操作的并行处理在审

专利信息
申请号: 202011112250.6 申请日: 2018-02-22
公开(公告)号: CN112288095A 公开(公告)日: 2021-01-29
发明(设计)人: 伊恩·莫里·麦克拉伦;诺曼·保罗·约皮;赵翔;格雷戈里·米歇尔·索尔森;比亚克·哈默肖特·鲁纳 申请(专利权)人: 谷歌有限责任公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 周亚荣;邓聪惠
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标量 数据 广播 操作 并行 处理
【说明书】:

本申请涉及非标量数据的大数据集的约简和广播操作的并行处理的方法、系统和装置,包括编码在存储介质上的指令,用于执行梯度向量和类似结构化数据的约简,所述梯度向量和类似结构化数据例如在以由节点之间的至少两个维度上的连接定义的网格或环面拓扑组织的节点上并行生成。所述方法提供了拓扑中的节点之间的并行计算和通信。

分案说明

本申请属于申请日为2018年2月22日的中国发明专利申请201810153965.2的分案申请。

技术领域

本说明书涉及并行处理非标量数据的大数据集。

背景技术

机器学习模型接收输入并基于接收到的输入和模型参数的值而生成输出。这些模型通常需要使用接收到的输入来训练,所述输入是非常大的数据集。

发明内容

本说明书描述了大体涉及大数据集的并行处理,并且具体涉及用于更快地约简、映射、和广播操作的各种拓扑中的大数据集的并行处理的技术。

一般而言,本说明书中描述的主题的一个创新方面可以实施在用于处理训练数据的方法中。所述方法包括在以包括节点的行和列的环面(torus)拓扑组织的多个节点中的每个节点上训练机器学习模型的相应副本,其中,每个节点是在相应训练数据批次上并行训练的,由此在训练之后每个节点保持由训练产生的相应梯度向量。节点中的各个梯度向量可以通过执行操作来组合以生成最终梯度向量,所述操作包括:通过在节点上执行的代码,对环面的行并行地执行改进的旋转钳式算法而不进行广播,以在每一行中生成梯度向量的每个相应不相交场的组合数据,由此当该行处理完成时,每一列包含梯度向量数据的相应相同不相交场的所有组合数据;并且然后通过在节点上执行的代码,在环面中的列中的每一列中执行第二环形算法,包括向每一列中的所有节点广播该列中的相应最终列结果;并且然后跨环面的每一行复制最终列结果,由此环面的每个节点保持最终梯度向量。

这些和其它实施例可以可选地包括以下特征中的一个或多个。第二环形算法可以是改进的旋转钳式算法。多个节点可以在单个模块上实现。每个节点可以在单独的集成电路上实现。模块可以是集成电路。执行改进的旋转钳式算法可以包括执行改进的旋转钳式算法以生成梯度向量的每个相应不相交场的求和数据。环面可以由节点的行和列组成。环面拓扑还可以包括节点层,每一层由节点的相应行和列组成。对每一行执行改进的旋转钳式算法可以包括:对于每一行中的每个节点,使用所述节点作为改进的钳式算法的实例化的开始节点,所述改进的钳式算法将所述节点的不相交场的一半发送到该行的环中的两个相邻节点中的每一个;以及从该节点开始执行改进的钳式算法。

对于该行中的每个起始节点,与起始节点相对的每个结束节点可以向该行中的其它节点广播由该结束节点确定的最终场梯度向量。所述组合可以与沿着环面的行进行的组合并行地沿着列执行,其中每一行中的每个节点是该行中的起始节点,并且每一列中的每个节点是该列中的起始节点,并且每个起始节点处理该梯度向量的不同的相应不相交场。

在一些实施方式中,一种用于处理训练数据的方法可以包括:在以包括节点的行和列的环面拓扑组织的多个节点中的每个节点上训练机器学习模型的相应副本,其中,每个节点是在相应训练数据批次上并行训练的,由此在所述训练之后每个节点保持由所述训练得到的相应梯度向量;通过执行操作来组合节点中的相应梯度向量以生成最终梯度向量,所述操作包括:通过在节点上执行的代码沿着环面的每一行来执行相应环形约简,使得每一行中的每一节点对于最初在该行的节点中的每一梯度向量具有约简的向量;以及通过在节点上执行的代码,沿着环面的每一列执行相应的环形约简,在所述环形约简结束时每个节点保持相同的最终梯度向量。

这些和其它实施例可任选地包括以下特征中的一个或多个。所述环形约简可以使用旋转钳式算法来执行。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011112250.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top