[发明专利]一种基于GPU/CPU混合架构的流程序多粒度划分与调度方法有效
申请号: | 201510429763.2 | 申请日: | 2015-07-21 |
公开(公告)号: | CN104965761B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 于俊清;陈文斌;何云峰;管涛;唐九飞 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 廖盈春 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于GPU/CPU混合架构的流程序多粒度划分与调度方法,包括:根据数据流程序各个任务的计算特点以及任务之间的数据通信量,将任务分配到合适的计算平台上;利用GPU端任务的并行性将其均衡分裂到各个GPU,以避免GPU间高额的通信开销;通过选择CPU核,将CPU端各任务均衡分配给各CPU核,以保证负载均衡并提高CPU核的利用率;采用多种数据存储结构和多种访问类型的方法,以提高内存的访问效率;通过生成目标模板类和压缩目标结点的个数,降低目标代码的冗余量。本发明在CPU与GPU平台上实现了负载均衡,提高了数据流程序的执行性能。 | ||
搜索关键词: | 一种 基于 gpu cpu 混合 架构 流程 粒度 划分 调度 方法 | ||
【主权项】:
1.一种基于GPU/CPU混合架构的流程序多粒度划分与调度方法,其特征在于,包括:步骤1引入扩大因子,将计算任务actor稳态执行次数整体扩大;步骤2根据actor是否具有可并行性以及相应通信开销的大小将其分配到GPU端或CPU端上去运行;步骤3根据actor连续迭代执行是否存在数据依赖性,将其水平分裂到各GPU端;步骤4选择合适的CPU核数量,将CPU端任务均衡分配给各CPU核;步骤5对SDF图进行拓扑排序以满足数据的读写规则,依次遍历拓扑排序中的各actor,确定各actor被流水调度执行时的阶段号;步骤6根据各actor的通信特点,采用不同存储结构和不同访问类型进行数据流程序的存储访问优化;步骤7根据各actor的计算特点,压缩计算相同的actor的目标代码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510429763.2/,转载请声明来源钻瓜专利网。