[发明专利]一种异构众核离散访存优化方法在审
申请号: | 201510830202.3 | 申请日: | 2015-11-24 |
公开(公告)号: | CN105468567A | 公开(公告)日: | 2016-04-06 |
发明(设计)人: | 袁欣辉;潘治;林蓉芬;王礼生 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F15/167 | 分类号: | G06F15/167 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 龚燮英 |
地址: | 214083 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 异构众核 离散 优化 方法 | ||
技术领域
本发明涉及计算机技术领域,更具体地说,本发明涉及一种异构 众核离散访存优化方法。
背景技术
异构众核处理器是一种新颖的处理器架构,它将通用处理器(主 核)与加速核心簇(从核)封装在一起,提供很高的计算性能。但这种架 构主、从核簇共享处理器访存带宽,当数据局部性较差时,处理器的 实际访存带宽明显低于访问连续数据时的带宽。对于数据密集型应 用,访存瓶颈效应明显。其中,数据局部性包括时间局部性和空间局 部性。时间局部性指一小段时间内,最近访问过的数据很可能再次访 问;空间局部性指一小段时间内程序访问的数据集中在一小片存储 区,刚被访问的数据附近的数据很可能接下来被访问。
目前与这种新架构最接近的是CPU(CentralProcessingUnit,中 央处理器)+GPU(GraphicsProcessingUnit,图形处理器)的混合架 构,为提高在该架构上的离散访存(指程序访问的数据局部性较差) 性能,使用CPU与GPU同时访存,首先根据二者各自的访存带宽按 固定比例将任务分配给CPU和GPU,再将GPU获取的任务根据线 程数平均分配,以达到整体较优的课题性能结果。
CPU+GPU混合架构下CPU和GPU的访存通路是独立而互不影 响的,因此可以方便的根据各自的带宽固定任务分配的比例。然而这 种方法难以直接应用在异构众核处理器上:异构众核处理器主、从核 共享访存带宽,各核心的访存可能引起冲突而导致其他核心访存性能 下降,此外各核心发出的访存指令完全是无序、随机、不可预测的, 这使得主核与从核簇的访存带宽比例是不固定的;此外,由于每个任 务实际访存量的不同,各个任务的负载强度有差异,从核簇上任务的 平均划分会使得负载不均衡,负载重的核心会拖累课题的性能,因此 按照该比例划分任务也是不可行的。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提 供一种异构众核离散访存优化方法,能够利用异构众核处理器的硬件 特点,改进离散访存的性能,以提高数据密集型应用的性能。
为了实现上述技术目的,根据本发明,提供了一种异构众核离散 访存优化方法,其特征在于包括:
第一步骤:将总任务划分为多个任务片段;
第二步骤:在主核与从核均可访问的存储空间设立一个计数变 量;
第三步骤:判断计数变量的值是否小于总任务的片段数,如果判 定计数变量的值小于总任务的片段数则执行第四步骤;
第四步骤:主核和每个从核从任务池中动态取出任务片段,对计 数变量做原子加1操作,并针对取出的任务片段完成访存操作;随后 处理返回第三步骤。
优选地,在第三步骤中,如果判定计数变量的值等于总任务的片 段数,则判定任务处理完毕,处理终止;否则主核和从核簇中的每个 从核动态从任务池中取出访存任务处理。
优选地,在第一步骤中,将总任务划分为预定数量的任务片段; 第四步骤中,主核和每个从核动态请求某个访存任务片段并处理。
优选地,在第一步骤中,将总任务划分为预定大小的任务片段; 第四步骤中,主核与从核同时完成访存任务,且任务动态分配。
优选地,任务片段的预定大小可被调节,主核与从核同时完成访 存任务,且任务动态分配。
使用本发明的方法可使主核与从核簇同时访存,能够充分利用芯 片访存带宽,且利用主核Cache,当Cache命中时主核完成任务不占 用带宽,上述方法的实际离散访存带宽可能高于总带宽;且动态的任 务划分方式有效解决了主核与从核簇间难以确定任务划分比例以及 各核心上负载不均拖累课题性能的问题。本发明提供了动态任务划分 方法,既能充分利用异构众核处理器的访存带宽,又能根据实际运行 情况灵活、动态的划分主核与从核簇、从核簇各核心间的任务量,可 有效缓解异构众核处理器上的离散访存瓶颈问题。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明 有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1示意性地示出了根据本发明优选实施例的异构众核离散访 存优化方法的流程图。
需要说明的是,附图用于说明本发明,而非限制本发明。注意, 表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似 的元件标有相同或者类似的标号。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510830202.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高效的粗粒度可重构计算系统
- 下一篇:用于计算数据的方法和设备