[发明专利]一种自动配置GPU扩展箱的方法在审
申请号: | 202110020022.4 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112651162A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 黄永 | 申请(专利权)人: | 中天恒星(上海)科技有限公司 |
主分类号: | G06F30/23 | 分类号: | G06F30/23;G06F16/2455;G06F9/50 |
代理公司: | 深圳知帮办专利代理有限公司 44682 | 代理人: | 颜为华 |
地址: | 200050 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 配置 gpu 扩展 方法 | ||
本发明涉及配置GPU扩展箱技术领域,具体地说,涉及一种自动配置GPU扩展箱的方法。其方法步骤如下:数据流挖掘:采用CUDA计算模型对数据流进行挖掘,拓扑优化:采用BESO算法软删除的方式实现单元的增减,并行计算:在预处理阶段进行显存空间分配,并将计算模型信息从主机复制到设备,然后采用异步执行的方式进行数据传输,数值检测:采用二维和三维结构优化检测试精度和计算效率,本发明可以在对GPU扩展箱与CPU之间配置时,可以在保证计算精度的前提下,极大的提高二维和三维拓扑优化问题的计算效率,配置的准确性和配置效率高。
技术领域
本发明涉及配置GPU扩展箱技术领域,具体地说,涉及一种自动配置GPU扩展箱的方法。
背景技术
将多个GPU集成到一个扩展箱内,形成GPU扩展箱,从而实现GPU资源的池化,便于GPU资源的调度,GPU和CPU之间通过PCIE接口连接的方式就是GPU扩展箱的连接拓扑,实际应用中,在进行GPU配置时,多GPU设计就是会使服务器变得比较庞大,而且和其他标卡设计兼容性不好,同样这样PCIE结构就会成为GPU之间数据交换处理的瓶颈,严重影响多GPU架构下多GPU的性能发挥,但是,传统的并行计算方法的硬件昂贵,编程和软件操作也需要专业化的技能,不利于推广使用,同时配置容易出现GPU扩展箱配置误差,配置的准确性和配置效率不够高,从而影响计算机的性能,随着图形处理器( GPU)技术的快速发展,当前GPU已经发展成为具有极高并行计算能力的通用并行处理器,这使得基于GPU的通用计算技术( GPGPU)硬件成本且实现容易,逐步成为了近几年的一个研究热点,但是这导致大规模的拓扑优化问题会产生庞大的计算量,常规的计算将十分耗时,极大的限制了拓扑优化方法,鉴于此,我们提出一种自动配置GPU扩展箱的方法。
发明内容
本发明的目的在于提供一种自动配置GPU扩展箱的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供一种自动配置GPU扩展箱的方法,其方法步骤如下:
S1、数据流挖掘:采用CUDA计算模型对数据流进行挖掘;
S2、拓扑优化:采用BESO算法软删除的方式实现单元的增减,不会真正的删除单元,保证了迭代过程中有限元模型的统一性,具有很好的并行性;
S3、并行计算:在预处理阶段进行显存空间分配,并将计算模型信息从主机复制到设备,然后采用异步执行的方式进行数据传输配置,有利于减少中间结果数据输出对程序执行效率的影响;
S4、数值检测:采用二维和三维结构优化检测试精度和计算效率。
作为本技术方案的进一步改进,所述S1中的CUDA计算模型采用数据流分位数并行算法。
作为本技术方案的进一步改进,所述数据流分位数并行算法包括以下步骤:
①、初始化,分配主机缓冲区和设备内存;
②、从数据流源中获取并向设备交换一块数据;
③、启动设备内核,执行数据流分位数并行计算子算法GPUQuantilesHistogram;
代码如下:FOR elements in block B
IFB[i]maxorB[i]min
Normalize B[ i]into [ min, max] ENDIF
intj = GpuHash( B[ i])
SynopsisHist[j] ++;
④、更新基本窗口、删除过期基本窗口;
⑤、如果接到On-time查询请求,执行数据流分位数并行查询子算法GPUQuantilesQuery;
代码如下:sharedMem[ tid] = source[ index]
int tid = threadldx. x//对于块内每个线程
for(len1; len0;len =1){ //b len次迭代完成求和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中天恒星(上海)科技有限公司,未经中天恒星(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110020022.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐磨辊面磨损在线均化机构
- 下一篇:一种基于电缆组件的全自动精准热缩系统