[发明专利]用于利用约简操作来支持数据并行循环的计算引擎架构在审
申请号: | 201810018954.3 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108268283A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | G·凡卡德希;D·马尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 描述了涉及用于利用约简操作来支持数据并行循环的计算引擎架构的技术。在一些实施例中,硬件处理器包括存储器单元和多个处理元件(PE)。PE中的每一个PE都经由一个或多个邻至邻链路直接与一个或多个相邻PE耦合,使得每一个PE都能够:从相邻PE接收值;将值提供给相邻PE;或者既从一个相邻PE接收值,又将值提供给另一相邻PE。硬件处理器还包括控制引擎,该控制引擎与多个PE耦合,用于使多个PE共同执行任务,以便通过每一个PE执行该任务的同一子任务的一个或多个迭代来生成一个或多个输出值。 | ||
搜索关键词: | 硬件处理器 并行循环 计算引擎 控制引擎 耦合 约简 架构 存储器单元 处理元件 迭代 链路 输出 | ||
【主权项】:
1.一种在第一硬件处理器(HP)中的方法,所述方法包括:由所述第一HP确定任务已从第二HP卸载到所述第一HP,所述第一HP包括区块化为多个区块的存储器单元和多个处理元件(PE),每一个PE都经由一个或多个邻至邻链路直接与一个或多个相邻PE耦合,使得每一个PE能够:从相邻PE接收值,将值提供给相邻PE,或者既从一个相邻PE接收值,又将值提供给另一相邻PE;以及由所述第一HP执行所述任务,所述执行包括使所述多个PE中的每一个PE执行所述任务的同一子任务的一个或多个迭代,其中,对于迭代中的每一个迭代,所述多个PE中的PE用于:访问从所述存储器单元获取的一个或多个数据值;以及既基于从第一相邻PE接收的第一值和所述一个或多个数据值中的至少一个数据值来确定值,又将所确定的值提供给第二相邻PE,以供所述第二相邻PE在执行所述子任务的迭代时使用,其中,对所述任务的执行使所述第一HP确定一个或多个输出值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810018954.3/,转载请声明来源钻瓜专利网。