[发明专利]一种数据流处理器指令映射方法及系统、装置在审
申请号: | 201911011823.3 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110941451A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 安述倩;张明喆;叶笑春;王达;张浩;范东睿;唐志敏 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;张燕华 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据流 处理器 指令 映射 方法 系统 装置 | ||
本发明涉及一种数据流处理器指令映射方法,包括:根据数据流图,对初始指令序列进行广度优先遍历的排序,得到按照深度优先排序的最终指令序列;将该最终指令序列划分为多个指令子序列,对所有该指令子序列依次进行指令映射,生成多个子映射布局;合并所有该子映射布局为用于数据流处理器执行该初始指令序列的最终映射布局。本发明的指令映射方法处理平衡网络拥塞度、网络负载、PE间流水、负载均衡等各种因素之外,还通过划分指令子空间的方式,分组并行进行映射布局的探索,从中选择最优的结果作为最终的映射布局,这种方式保证了映射质量的同时增加了算法的并行性,提高同等映射质量下的算法运行速度。
技术领域
本发明涉及计算机体系结构,特别涉及一种数据流处理器的指令映射方法和系统。
背景技术
数据流处理器上的程序需要进行静态的映射,图1是数据流程序及数据流图的示例图。如图1所示,数据流图的程序由代码段、数据流图以及数据组成,在进入执行阵列执行之前,编译器需要根据数据流图,生成代码在执行阵列上的布局,产生的映射结果决定了指令在执行阵列上的分布及执行阵列之间的通讯路径。在数据流处理器结构中,一旦数据准备好,指令就可以执行,数据的延迟供给会造成性能下降,所以映射算法在极大程度上影响处理器的性能。
现有的数据流处理器根据指令映射以及调度的方式不同,分为SPSI(StaticPlacement Static Issue)数据流处理器和SPDI(Static Placement Dynamic Issue)数据流处理器;SPSI处理器在执行数据流程序之前,通过编译器确定指令所在的执行单元(PE,Process Element)以及每条指令开始执行的时间,SPDI处理器通过编译器确定指令所在的执行单元,但是由硬件根据指令是否获得了充足的数据来动态决定每条指令的执行时间。SPSI的指令映射重点在于解决按时间展开的结构上的调度和路由问题,这一问题可以通过硬件结构来解决;SPDI的指令映射重点在于优化指令在执行阵列上的布局,减少指令间交互需要的时间,提高数据流处理器的整体性能。
在进行指令映射时,相互之间有数据交互的指令放在不同的执行单元时,会形成一个逻辑的空间交互网络,利用网络拥塞模型(M.Zhang,et al.,“Comrance:A rapidmethod for network-on-chip design space exploration,”in 2016SeventhInternational Green and Sustainable Computing Conference(IGSC).IEEE,2016,pp.1–8.)中的评价方式网络拥塞度来衡量网络的质量。图2是3×3的网络(Mesh)结构示意图,图3是图2的Mesh结构的网络拥塞度示意图。网络拥塞度的定义图2、图3所示:
图2所示的3×3的Mesh结构,其中1-12表示链路(Link),a-i表示节点(node),node之间通信需要占用的link,可以形成如图3所示的通信矩阵,矩阵每一行代表一个link,每一列代表一个通信对通信需要占用的link,如果占用,就在对应的位置标志1,代表当前Link的负载为1,每一行的综合代表当前Link的负载,而所有Link负载的最大值则是网络传输中的瓶颈,定义为网络拥塞度,用来评价当前网络的传输质量。
现有数据流处理器指令映射方法难以对大规模应用实现高效指令映射,需要一种指令映射方法,降低数据流处理器执行指令时的网络拥塞度,有效提高系统性能。
发明内容
针对上述问题,本发明从提高数据在片上传输的连续性入手,通过对指令映射与片上通信特性的关系进行分析,提升指令映射的有效性和速度。
具体来说,本发明提出一种数据流处理器指令映射方法,包括:根据数据流图,对初始指令序列进行广度优先遍历的排序,得到按照深度优先排序的最终指令序列;将该最终指令序列划分为多个指令子序列,对所有该指令子序列依次进行指令映射,生成多个子映射布局;合并所有该子映射布局为用于数据流处理器执行该初始指令序列的最终映射布局。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911011823.3/2.html,转载请声明来源钻瓜专利网。