[发明专利]GPGPU网络请求报文无冲突发送方法有效
申请号: | 201510736872.9 | 申请日: | 2015-11-02 |
公开(公告)号: | CN105391610B | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 王志英;赵夏;马胜;王鹏;王璐;李晨 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | H04L12/40 | 分类号: | H04L12/40 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpgpu 网络 请求 报文 冲突 发送 方法 | ||
本发明公开了一种GPGPU网络请求报文无冲突发送方法,目的是利用简单的路由器来高效的传输请求报文。技术方案是先将数据链路带宽为b bit的n*n的mesh网络划分成n个相互独立的Mesh子网;然后简化Meshy中路由器的微体系结构;计算结点Ci通过与其相连的Meshy将请求报文传输给目的节点Mj。采用本发明可无冲突地发送请求报文,且硬件开销小,功耗消耗低,降低了片上网络的硬件开销和功耗开销。
技术领域:本发明涉及GPGPU(General-Purpose Grahpic-Processs-Unit,通用图形处理器)对请求报文的发送方法,尤其涉及GPGPU请求网络只利用低硬件开销与低功耗开销来传递请求报文的无冲突发送方法。
背景技术:根据摩尔定律的预测,每18个月单位面积晶体管的数目将翻一翻。越来越多的晶体管资源在给处理器带来巨大计算能力的同时也给处理器体系结构的设计带来了巨大的挑战。随着晶体管数量的不断增加,增加流水线的深度所带来的频率提升面临着功耗和物理极限等方面的挑战,因此单核的计算能力已经达到极限。从2005年起,Intel和AMD公司开始争相推出多核处理器,利用多个计算能力较弱的小核来替换单个计算能力很强的大核以获得整体性能的提升。
为了协同计算,处理器中不同核之间需要进行通信来完成数据的交换,最初的多核片内系统采取了基于总线的通信结构。所有的核连接到一个中央总线,总线仲裁采取集中控制的方式。但是总线结构的可扩展性极差,随着片上核数的不断增加,总线互连在功耗、延迟、时钟同步、信号完整性以及带宽等方面已不能满足新的需求,片上网络逐渐成为多核互连通信的新范式。在CMP(Chip Multiprocessor,片上多核)系统中,mesh网络是最流行的片上网络设计,因为它具有结构简单,扩展性,通用性较好等优点(文献《Principlesand Practices of Interconnection Networks》)。
图1是计算节点、存储节点通过mesh网络进行通信的示意图。散布全芯片的相邻路由器(共n2个)之间通过带宽为b bit的数据链路相连构成n*n的mesh网络(n行路由器,n列路由器),计算核、存储核通过网络接口NI(Network Interface)分别与一个路由器相连,n2-n个计算核、n个存储核之间通过mesh网络传递消息报文。计算核和网络接口组合在一起统称为计算节点,图1中简写为Ci,i为计算节点的编号(0≤i≤n2-n-1);存储核和网络接口组合在一起统称为存储节点,简写为Mj,j为存储节点的编号(0≤j≤n-1)。路由器简写为Rk,其中k为路由器的编号(0≤k≤n2-1)。在mesh网络中,每一列仅有一个路由器与存储节点相连,其余路由器均与计算节点相连,例如在图1中,第一列中路由器R0,R1到Rn-2分别与计算节点C0,C1到Cn-2相连,Rn-1与存储节点M0相连。因此,mesh网络的每列连有n-1个计算节点,连有1个存储节点。每一个计算节点、存储节点中都存有一张mesh网络中的路由器的编号与计算节点编号和存储节点编号的连接映射表,在得知计算节点、存储节点编号的情况下均可以查询出与之相连的路由器的编号。当发送报文时,计算核和存储核根据目的节点的编号查询出与之相连的路由器的编号,然后将路由器编号写入报文头部,接着将产生的报文放到与该核相连接的网络接口的发送报文缓存队列中,然后由与该网络接口相连的路由器取出后开始在mesh网络中进行传输。报文在mesh网络的传输过程中,接收到报文的路由器根据报文头部中存储的路由器编号计算出该报文所对应的输出端口,如果输出端口为0,则说明当前路由器为该报文的目的路由器,该路由器通过0号输出端口将报文存储至与该路由器相连的网络接口的接收报文缓存队列中;如果输出端口为1到4,则该路由器通过相应的输出端口将报文传递给下一跳的路由器。接收报文时,计算核和存储核从与该核相连接的网络接口的接收报文缓存队列中取出报文进行处理。为了解决发送速度过快而接收速度过慢时接收报文缓存队列溢出的问题,传统的路由器一般采取基于输入端口缓存的流控机制对发送报文的速度进行调节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510736872.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于FIP通信的网络控制模块
- 下一篇:一种报文传输方法及设备