[发明专利]用于GPU任务调度的连续分析任务在审
申请号: | 201880035453.4 | 申请日: | 2018-05-25 |
公开(公告)号: | CN110678847A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 史蒂文·托尼·泰伊;布莱恩·L·萨姆纳;布拉德福德·迈克尔·贝克曼;苏拉杰·普索尔 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 31263 上海胜康律师事务所 | 代理人: | 李献忠;张静 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 队列 连续包 连续分析 任务完成 系统实现 硬件加速 入队列 代理 退出 调用 分析 调度 参考 应用 管理 | ||
公开了用于实现连续分析任务(CAT)的系统、设备和方法。在一个实施方案中,一种系统实现CAT的硬件加速来管理由多个任务构成的应用的依赖性和调度。在一个实施方案中,连续包由第一任务直接参考。当所述第一任务完成时,所述第一任务将连续包排入第一队列中。所述第一任务可以指定将所述连续包放在哪个队列中。负责所述第一队列的代理使所述连续包退出队列并执行所述连续包,所述连续包调用在确定将哪些依赖任务排入队列之前执行的分析阶段。如果在所述分析阶段期间确定第二任务现在准备好被发起,则将所述第二任务排入所述队列中的一者中。然后,负责该队列的代理使所述第二任务退出队列并执行所述第二任务。
背景技术
相关技术的描述
任务并行应用因为能够有效地利用并行执行资源而在高性能计算(HPC)领域中变得日益流行。然而,关于任务并行应用的挑战中的一项是有效地管理依赖性。当前依赖性跟踪和解决方法,诸如异构系统架构的(HSA的)架构队列语言(AQL)屏蔽包或软件管理的集中依赖性跟踪表效率不高。具体地说,当AQL屏蔽包由图形处理单元的(GPU的)命令处理器直接执行时,包本身可能阻隔任务队列并使谨慎的队列管理为必要的。同时,当前软件依赖性跟踪解决方案需要主机中央处理单元(CPU)线程参与GPU调度,这防止依赖任务的低延迟分派。另外,一些软件依赖性跟踪解决方案使用不按比例绘制的集中跟踪表。
附图说明
通过结合附图参考以下描述可以更好地理解本文中描述的方法和机构的优点,附图中:
图1是计算系统的一个实施方案的框图。
图2是计算系统的另一实施方案的框图。
图3是示出用于实现连续分析任务(CAT)的方法的一个实施方案的一般化流程图。
图4是示出用于实现CAT的方法的另一实施方案的一般化流程图。
图5是示出用于实现CAT的方法的另一实施方案的一般化流程图。
图6是示出用于实现CAT的方法的另一实施方案的一般化流程图。
图7是示出用于实现CAT的方法的另一实施方案的一般化流程图。
图8是示出用于使CAT指定CPU任务的方法的一个实施方案的一般化流程图。
图9是示出用于处置内核完成的方法的一个实施方案的一般化流程图。
具体实施方式
在以下描述中,阐述众多具体细节以提供对本文中呈现的方法和机构的透彻理解。然而,本领域技术人员应认识到,可以在没有这些具体细节的情况下实践各种实施方案。在一些情况下,未详细示出众所周知的结构、部件、信号、计算机程序指令和技术以避免使本文中描述的方法模糊不清。应了解,为了简单和清楚地进行说明,图中所示的元件不一定按比例绘制。例如,元件中的一些的尺寸相对于其他元件可能被夸大。
本文中公开了用于实现连续分析任务(CAT)的系统、设备和方法。在一个实施方案中,一种系统包括多个命令处理器、多个队列和多个计算单元。在一个实施方案中,所述系统被配置为实现CAT的硬件加速,所述CAT被设计为处置由多个任务构成的应用的依赖性和调度。CAT可以由指定其母任务的数据结构,由AQL包直接参考,或CAT可以与信号联结。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880035453.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:神经网络的动态任务分配
- 下一篇:跨装置的通用数据访问