[发明专利]一种异构计算系统在审
申请号: | 201610159081.9 | 申请日: | 2016-03-18 |
公开(公告)号: | CN105843692A | 公开(公告)日: | 2016-08-10 |
发明(设计)人: | 杨浩;章玲玲;肖勇才;李轶鹏;林楠 | 申请(专利权)人: | 国家电网公司;国网江西省电力科学研究院 |
主分类号: | G06F9/54 | 分类号: | G06F9/54;G06T1/20 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 王刚;龚敏 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种异构计算系统,其包括多层存储空间复杂结构体,其存储器结构包括六种存储器:全局存储器、寄存器、本地存储器、共享存储器、常量存储器、纹理存储器,其中前三者支持读/写操作,而后两者只具备读操作;这些存储器的结构各异、运算速度不同、大小及存储规模不一样。本发明相较于现有技术提高了CPU+GPU异构计算方法的效率。 | ||
搜索关键词: | 一种 计算 系统 | ||
【主权项】:
一种异构计算系统,其包括多层存储空间复杂结构体,其存储器结构包括六种存储器:全局存储器、寄存器、本地存储器、共享存储器、常量存储器、纹理存储器,其中前三者支持读/写操作,而后两者只具备读操作;这些存储器的结构各异、运算速度不同、大小及存储规模不一样,其中共享存储器、寄存器以其独特的结构组成方式在这些存储器中在数据流访问操作速度方面是相对较快的;对于每个并行的运算线程来说,寄存器、局部存储器都是私有的,也就是说每个线程单独存在使用各自的寄存器及局部寄存器;其中作为GPU上的高速缓存区,寄存器能够在极低延迟的情况下别每个线程的ALU所读取;数量客观的寄存器文件构成了寄存器的基础单元,并且被分配给每个正在执行的并行线程,因此,在并行执行的过程中每个线程所拥有的寄存器大小及其有限,在编程过程中应尽量为每个线程分配足够且较少的的私有变量;局部存储器是寄存器在线程执行过程中的补充,当寄存器使用过多,或者并行使用到结构体、数组这样的大数据变量,局部寄存器就充当暂时的收容所,为这些私有数据分配必要的存储空间;与寄存器类似,共享存储器同样也是GPU上的高速存储器,存在于共享存储器的数据是被同一个线程块(Block)中的所有线程共享的,分配这样一种存储器的目的在于减小线程块内各个线程的通信延迟;因为共享寄存器的存在,其在保存共用计数器或者线程块内的公共结果时,省去大量时间进行线程间通行,所以相应的速率会提升很多;对于全局存储器,GPU、CPU可以直接访问操作其中的全局数据,也就是说执行并行运算的任意一个线程、串行运算的部分都可以读写当中的任意区域的数据,但访问操作过程有很高的延迟;同样位于显存的常数存储器拥有缓存加速,且为只读存储器;GPU分配给常数存储器的空间只有64K,可用于存储并行运算执行过程中需要多次读取的只读变量;纹理存储器的纹理内存存在缓存从而减少了对内存的请求并提供更高的带宽。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网江西省电力科学研究院,未经国家电网公司;国网江西省电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610159081.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种SCR隔板成组模具
- 下一篇:一种浏览器中进程间通信的方法和装置