[发明专利]面向异构众核处理器的并行离散更新方法有效
申请号: | 201910904039.9 | 申请日: | 2019-09-24 |
公开(公告)号: | CN112632089B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 姜小成;尤洪涛;毛兴权;顾龙;张立博;孙俊 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F16/23 | 分类号: | G06F16/23 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214083 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 异构众核 处理器 并行 离散 更新 方法 | ||
本发明公开了一种面向异构众核处理器的并行离散更新方法,包括以下步骤:S1、对地址连续的离散更新数据区进行块划分,并将数据块与从核进行映射,使得每个从核负责其中一个数据块的更新;S2、每个从核将指令执行过程中产生的离散更新请求进行分类,分为需从核自己处理的离散更新请求和需其它从核处理的离散更新请求,并在产生离散更新请求的地方插入相应的处理函数;S3、需从核自己处理的离散更新请求按程序段func1的处理流程进行处理;S4、需其它从核处理的离散更新请求按程序段func2的处理流程进行处理。本发明可以实现较高性能的并行离散更新,并可以处理LDM空间装不下的大数据离散更新问题。
技术领域
本发明属于计算机编译与优化技术领域,尤其涉及一种面向异构众核处理器的并行离散更新方法。
背景技术
离散更新有两种:一种是先写后读的,表明循环迭代之间存在相关性,这样的循环通常无法进行并行化;另外一种是写相关的,只要保证写操作的原子性,即可以进行并行化。
通常在异构众核平台上采用生产者-消费者模式来解决离散更新问题:将从核划分为计算核(生产者)与更新核(消费者)两部分,生产者负责离散更新请求(中间计算结果)的生产,确定该更新请求应该属于哪个消费者,并将其通过从核之间的通信机制发送给对应的消费者;消费者则接收更新请求并完成最后的数据更新操作。生产者只负责生产离散更新请求,消费者只负责消费数据更新请求,生产者与消费者互相配合完成离散数据的更新操作。
生产者-消费者模式技术的缺点包括:1)必须按生产者-消费者模式的要求改造源码,将原始代码中一段简单的数组离散更新循环代码段改造为复杂的生产者-消费者代码段,不便于编译器进行程序的自动变换,降低了程序的可读性与可移植性;2)需要将从核组内的从核按比例划分为两部分:生产者和消费者,这个比例需要通过权衡从核处理能力、计算负载等因素来确定,或通过运行测试获得,加重了编程负担。
发明内容
本发明目的在于提供一种面向异构众核处理器的并行离散更新方法,该并行离散更新方法实现从核上的并行离散更新功能,便于编译器进行程序的自动变换,保持了原始程序良好的可读性与可移植性,不需要用户划分生产者与消费者,不增加用户负担。
为达到上述目的,本发明采用的技术方案是:一种面向异构众核处理器的并行离散更新方法,包括以下步骤:
S1、对地址连续的离散更新数据区进行块划分,并将数据块与从核进行映射,使得每个从核负责其中一块数据的更新,具体如下:
S11、对地址连续的离散更新数据区进行块划分的方法为:假设从核个数为N,离散更新数据区的总数据单元个数为M,对表达式“(M+N-1)/N”取整数,获得整数值m,然后将离散更新数据区按连续的m个单元为一组进行块划分,划分为N个数据块,其中前(N-1)个数据块的单元个数都是m,最后一个数据块的单元个数为(M-(N-1)*m);
S12、离散更新数据块与从核的映射方法为:第一个数据块由编号为0的从核负责更新,第二个数据块由编号为1的从核负责更新,依次类推,最后一个数据块由编号为N-1的从核负责更新;
S13、每个从核在开始执行并行核心循环之前,执行如下操作:
S131、初始化接收缓冲区的有效状态单元数组valid_stat[N],初始值设置为FALSE,其中N为从核数;
S132、更新请求处理状态单元数组deal_stat[N],初始状态设为TRUE;
S133、将与本从核号对应的主存内的离散更新数据块内容拷贝到LDM,形成本地副本;
S14、每个从核均记录离散更新数据区的起始地址a、离散更新数据区的总数据单元个数M、分块大小m、单个数据单元的字节长度b;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910904039.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:广告物料同步方法、装置、设备及介质
- 下一篇:一种建筑材料的加工装置