[发明专利]片上异构多核计算平台的性能加速方法有效
申请号: | 201110301740.5 | 申请日: | 2011-09-29 |
公开(公告)号: | CN102360313A | 公开(公告)日: | 2012-02-22 |
发明(设计)人: | 周学海;李曦;王超;陈香兰;张军能;冯晓静;王爱立 | 申请(专利权)人: | 中国科学技术大学苏州研究院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F15/80 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 范晴 |
地址: | 215123 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 片上异构 多核 计算 平台 性能 加速 方法 | ||
技术领域
本发明属于片上异构多核计算平台的性能优化技术领域,具体涉及一种片上多核计算平台的任务调度系统及其采用的性能加速方法。
背景技术
随着超大规模集成电路(VLSI)的复杂性按照摩尔定律飞速提高,单个处理器的性能提升已经到达极限,多核处理器已经成为微处理器体系结构发展的必然方向。特别是单片异构多核系统,它将通用处理器、DSP、ASIP、甚至混合信号电路等异构处理单元集成在同一块芯片上,充分发挥异构处理单元各自的优势,可以满足嵌入式系统对实时性和功耗等方面的要求,成为嵌入式系统的研究热点。
在对于给定的任务集合,为了能够使其在可重构计算平台上高效的完成,发挥可重构计算平台中各个器件的能力,首先需要对任务进行合理的划分,划分出在通用处理器(General-Purpose Processor,GPP)上运行的软件任务和布局在可重构逻辑单元上的硬件任务;同时还要决定任务与GPP和可重构逻辑单元的动态映射关系。软硬件任务划分和任务调度是保证任务集合在可重构计算平台上高效运行的重要技术。
由于片上多核系统上提供了充分的计算资源,为任务的高效运行提供了保证,因此,在此基础上提高任务集在多核平台上的并行性是提高系统吞吐率的一个有效手段。然而,在目前的异构多核系统中仍然存在两个关键问题:首先,如何对软硬件任务进行高效划分仍然是目前领域研究的一个难点。通常采用的软硬件任务划分方法无非是静态划分与动态划分:其中静态划分需要对任务进行预处理,在很多场景不能实现,而动态划分又会带来额外的开销,因此,如果存在一种行之有效的形式化软硬件划分描述,则会对任务划分带来明显的好处。常用的编程模型例如MPI也需要程序员对任务进行手动划分,甚至需要显示地进行任务的并行调度,从而任务能够取得的加速效果和性能提升收到了程序员本身的很大限制。
第二,随着片上集成度的不断增大,越来越多的计算资源可以集成到单块芯片中。与此同时,异构的计算资源能够发挥各自的计算性能优势,从而获得更高的任务并行性。而为了量化软硬件计算资源的数目给系统性能带来的性能提升,需要一种性能评价方法,便于对计算资源进行配置。
总的来说,目前的并行编程模型中的任务并行调度方法中的任务划分和调度方法均需要程序员进行手动干预和配置,从而限制了平台能够获得的性能优化效果,并且不能获得平台性能针对计算资源和任务序列的影响。本发明因此而来。
发明内容
为了克服背景技术中存在的不足,本发明的一个目的在于提供一个片上多核计算平台上的任务划分模块和利用所述任务划分模块所使用的性能优化方法,通过获得系统加速比与任务划分策略的关系来指导任务划分,并通过最大加速比与计算平台参数的关系来指导平台的配置。
为了解决现有技术中的这些问题,本发明提供的技术方案是:
一种片上异构多核计算平台的性能加速方法,所述片上异构多核计算平台包括执行任务的通用处理器、若干个硬件IP核以及核心调度模块;所述核心调度模块负责任务划分与调度,将任务分配到不同的计算单元上运行;其特征在于所述方法包括以下步骤:
(1)以单核处理器上运行的性能加速比为评价指标,在固定硬件平台的前提下评测核心调度模块的软硬件任务划分方案对加速比的影响,获得最优性能条件下硬件平台中的任务类型、通用处理器的数目、硬件加速部件的数目以及单个硬件加速部件的加速比参数;
(2)根据最优性能条件下硬件平台中的任务类型、通用处理器的数目、硬件加速部件的数目以及单个硬件加速部件的加速比参数进行硬件平台的重配置。
优选的,所述方法步骤(1)按照如下方法进行评测核心调度模块的软硬件任务划分方案对加速比的影响:
A1)首先,将平台中通用处理器与相同类型的IP核进行归类,按照计算处理时间进行降序排列,记录IP核的种类N,相应种类的IP核记作IPi,其中1≤i≤N;
A2)如果将IP1上超出IP2执行时间的任务全部转移的通用处理器的执行时间不超过IP2的执行时间,则将IP1对应的这部分任务转移到通用处理器上执行,否则,转移部分IP1的任务使IP1的执行时间和通用处理器的执行时间相同,评测结束;
A3)如果将IP1,IP2上超出IP3执行时间的任务全部转移到通用处理器的执行时间不超过IP3的执行时间,则将IP1,IP2对应的这部分任务转移到通用处理器上执行,否则,转移部分IP1,IP2的任务使IP1,IP2的执行时间和通用处理器的执行时间相同,评测结束;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学苏州研究院,未经中国科学技术大学苏州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110301740.5/2.html,转载请声明来源钻瓜专利网。