[发明专利]一种片上多核数据传输方法和装置无效

专利信息
申请号: 201110451374.1 申请日: 2011-12-29
公开(公告)号: CN102567278A 公开(公告)日: 2012-07-11
发明(设计)人: 张帅;焦帅;张浩;范东睿;李海忠 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06F15/173 分类号: G06F15/173
代理公司: 北京律诚同业知识产权代理有限公司 11006 代理人: 梁挥;祁建国
地址: 100080 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多核 数据传输 方法 装置
【说明书】:

技术领域

发明涉及多核处理器设计领域,特别是涉及一种多核处理器的片上数据传输方法和装置。

背景技术

在多核处理器设计中,对存储资源的访问是制约性能提高的主要因素。单纯通过提高时钟频率和改进缓存策略已经不能满足运行大规模并行程序时对访存带宽的要求。

传统多核处理器中,存储层次分为一级缓存,二级缓存,甚至多级缓存和片外存储。一级缓存一般设计在处理器核的内部,与处理器核的访存模块直接相连。二级缓存及多级缓存一般设计为多个或全部处理器核共享。上述缓存均为片上缓存,没有独立的地址空间,对程序员来说是不可见的。这种设计在传统的单核处理器中十分常见,利用硬件缓存可以快速访问到其映射的数据。这说明传统单核处理器的缓存没有自己的地址空间,而本设计的SPM(Scratch-pad Memory,简称SPM)是有自己地址空间的缓存。

目前,一级缓存可以通过软件接口部分配置成程序员可见的地址空间。但在传统多核处理器设计中,对二级缓存和片外存储的访问请求则必须由访存部件发出,程序员不能直接发出访存请求,而是由访存部件从各级缓存中取回数据,但这种方法传输的数据最长长度一般为二级缓存的行宽度。然而目前常见的并行应用程序常常需要大规模的数据传输,例如FFT(快速傅立叶变换),矩阵乘法运算等。因此传统片上缓存的数据传输方法已经成为限制提升计算速度的瓶颈。现有的片上缓存不能根据所运行的算法调整数据在缓存中的地址分配,对于具有本地缓存的多核处理器,传统缓存的空间局部性较差;而本设计可以让程序员根据自己的需求实现本地和远程地之间可控的数据传输,从而提高了缓存的利用率和空间局部性。

发明内容

为解决上述问题,本发明设计了一种片上多核数据传输方法和装置。

本发明的目的在于提供一种片上数据传输方法和装置,其能够大大降低片上网络的压力,并对数据规模和位置实现编程控制。

为实现本发明的目的而提供的一种片上多核数据传输方法,其特征在于,包括下列步骤:

步骤100,配置数据传输装置,通过软件接口生成控制数据传输装置的指令流,由处理器核将所述指令流发送给位于处理器核内部的数据传输装置,通过软件接口对数据传输装置进行如下配置判断数据传输类型;

步骤200,所述数据传输装置接收上述指令流,对发往同一片SPM或二级缓存的操作进行组合,由所述数据传输装置封装成可以在片上网络上传输的数据包;

步骤300,所述数据传输装置的发送模块查询片上网络,并对数据地址进行解析,给出目的SPM或二级缓存的坐标,当路由器指示可以传输时发送模块将数据包依次发送完毕;

步骤400,所述数据传输装置接收由目的SPM或二级缓存返回的数据或接收同步信号返回给控制模块,直至返回数据或同步信号数目与发送的请求相等,本装置控制模块向处理器核返回本次操作完成信号。

所述的片上多核数据传输方法,其特征在于,所述步骤100,还包括下列步骤:

步骤110.设置数据块宽度,设置源数据地址,设置源数据一维步长,设置源数据二维步长,设置目的数据地址,设置目的数据一维步长,设置目的数据二维步长,设置一维数据个数,设置二维数据个数;

步骤120.根据指令流配置数据传输装置的控制寄存器和数据寄存器。

所述的片上多核数据传输方法,其特征在于,所述步骤200,还包括下列步骤:

步骤210.由所述控制寄存器判断数据传输类型,对发往同一片远程SPM或二级缓存的操作进行组合;

步骤220.由所述发送模块封装成可以在片上网络传输的数据包。

所述的片上多核数据传输方法,其特征在于,所述步骤300,还包括下列步骤:

步骤310.所述发送模块把目的坐标为本地处理器核的数据包直接发给本地SPM,无需通过片上网络传输;

步骤320.所述数据传输装置的控制模块记录发送的数据包数目。

所述的片上多核数据传输方法,其特征在于,所述步骤400,还包括下列步骤:

步骤410.所述接收模块接收由目的SPM或二级缓存根据数据包中的指令返回的数据并写入本地SPM;

步骤420.所述接收模块接收由目的SPM或二级缓存返回的同步信号,并返回该数据传输装置的控制模块;

步骤430.判断所述返回数据或同步信号数目与发送的请求是否相等,若是,执行步骤440;否则,返回步骤410;

步骤440.所述控制模块向处理器核返回本次操作完成信号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110451374.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top