[发明专利]一种自动配置GPU扩展箱的方法在审
申请号: | 202110020022.4 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112651162A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 黄永 | 申请(专利权)人: | 中天恒星(上海)科技有限公司 |
主分类号: | G06F30/23 | 分类号: | G06F30/23;G06F16/2455;G06F9/50 |
代理公司: | 深圳知帮办专利代理有限公司 44682 | 代理人: | 颜为华 |
地址: | 200050 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 配置 gpu 扩展 方法 | ||
1.一种自动配置GPU扩展箱的方法,其方法步骤如下:
S1、数据流挖掘:采用CUDA计算模型对数据流进行挖掘;
S2、拓扑优化:采用BESO算法软删除的方式实现单元的增减;
S3、并行计算:在预处理阶段进行显存空间分配,并将计算模型信息从主机复制到设备,然后采用异步执行的方式进行数据传输配置;
S4、数值检测:采用二维和三维结构优化检测试精度和计算效率。
2.根据权利要求1所述的自动配置GPU扩展箱的方法,其特征在于:所述S1中的CUDA计算模型采用数据流分位数并行算法。
3.根据权利要求2所述的自动配置GPU扩展箱的方法,其特征在于:所述数据流分位数并行算法包括以下步骤:
①、初始化,分配主机缓冲区和设备内存;
②、从数据流源中获取并向设备交换一块数据;
③、启动设备内核,执行数据流分位数并行计算子算法GPUQuantilesHistogram;
④、更新基本窗口、删除过期基本窗口;
⑤、如果接到On-time查询请求,执行数据流分位数并行查询子算法GPUQuantilesQuery;
⑥、跳到②循环执行。
4.根据权利要求3所述的自动配置GPU扩展箱的方法,其特征在于:所述分位数计算公式如下:
其中,sumHist为随后对临时数组重复上面的过程直到只得到一行最终的求和结果。
5.根据权利要求1所述的自动配置GPU扩展箱的方法,其特征在于:所述S2中拓扑优化的计算公式如下:
其中,C为应变能,N为单元总数,xi为单元密度,Ki0为实单元刚度矩阵,p为惩罚因子,u为加载的力和位移向量。
6.根据权利要求5所述的自动配置GPU扩展箱的方法,其特征在于:所述BESO算法包括以下姿态:
姿态一:消除拓扑优化中常见的棋盘格现象,采用敏度再分配的滤波策略,计算公式如下:
其中,式中,k为所有共享j节点的单元数,ω(rij)是权重因子,即i单元的中心点到j节点的距离,ajn是j节点的敏度;
姿态二:决定单元的增减,首先计算下一个迭代步的目标体积,计算公式为:
Vk+1=V(1±ER),(k=1,2,3,…),式中,Vk为当前结构体积,ER为体积进化率。
7.根据权利要求1所述的自动配置GPU扩展箱的方法,其特征在于:所述S3中并行计算包括以下步骤:
①:单元位移:采用CUDA线程与单元一一映射的方式将第一层内部循环在GPU上并行执行得到单元位移,再将单元位移离散到节点位移中;
②:节点计算:采用CUDA线程与节点一一映射的计算方式完成第二层内循环的节点计算,再通过“聚集加”进行组装。
8.根据权利要求7所述的自动配置GPU扩展箱的方法,其特征在于:“聚集加”进行组装包括以下步骤:
①、根据线程块的大小对有限元模型进行分块;
②、线程块将所有节点值缓存到对应的共享存储器内;
③、节点计算结束后,将节点信息直接存储到对应的全局显存。
9.根据权利要求8所述的自动配置GPU扩展箱的方法,其特征在于:所述节点信息数量计算公式:
Z=(BX+2)*(BY+2)
其中,Z为节点信息数量,BX*BY为线程大小。
10.根据权利要求1所述的自动配置GPU扩展箱的方法,其特征在于:所述S4中数值检测包括以下姿态:
姿态一:二维梁,根据对称性,对其中的一边进行网格划分并加载;
姿态二:三维悬臂梁,当模型的三个维度分别划分256个、120个以及120个单元时,对比CPU和GPU的优化结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中天恒星(上海)科技有限公司,未经中天恒星(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110020022.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐磨辊面磨损在线均化机构
- 下一篇:一种基于电缆组件的全自动精准热缩系统