[发明专利]薄板无网格Galerkin结构动力响应分析的GPU加速方法有效
申请号: | 201910212828.6 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109960865B9 | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 龚曙光;许延坡;卢海山;张建平;左志坚 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F17/16;G06F119/14;G06F117/08 |
代理公司: | 湘潭市汇智专利事务所(普通合伙) 43108 | 代理人: | 宋向红 |
地址: | 411105*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种薄板无网格Galerkin结构动力响应分析的GPU加速方法。它通过CPU将薄板数据读入到主机内存,根据输入数据计算GPU并行所需相关数据,并将得到的数据复制到GPU全局存储器中;在GPU上设置线程块与线程数量,并行加速计算节点相应的形函数值,然后建立GPU线程块与交叉节点对一一映射模式,并行加速组装薄板的总体刚度矩阵与质量矩阵;在GPU上根据边界条件修正总体刚度矩阵,然后由质量矩阵和修正后的刚度矩阵求得阻尼矩阵、有效刚度矩阵,并将有效刚度矩阵采用三角分解;在GPU中采用Newmark法对薄板进行动力响应分析,最后输出求解的位移、速度和加速度的结果。本发明极大地提高了动力响应分析的求解效率。 | ||
搜索关键词: | 薄板 网格 galerkin 结构 动力 响应 分析 gpu 加速 方法 | ||
【主权项】:
1.一种薄板无网格Galerkin结构动力响应分析的GPU加速方法,其特征在于包括如下顺序的步骤:(1)通过CPU读取薄板的节点坐标、背景积分网格、材料物理性能、约束条件和动态载荷数据,以及求解设置参数与动力响应的计算时间步长,并存储至主机内存中;在薄板内部和位移边界布置积分点,并求解薄板内部和位移边界上的积分点数据;通过对薄板的节点、积分点循环搜索,确定每个节点影响域内的积分点数据,以及每个积分点定义域内的节点数据;再对薄板的节点循环搜索,确定交叉节点对信息;然后,将薄板内部和位移边界上的积分点数据、交叉节点对信息存储至主机内存中;(2)在CPU上将薄板的节点坐标、积分点数据、积分点定义域内的节点数据、交叉节点对信息由主机内存复制到GPU全局存储器中,设置GPU中的线程块与线程的数量,并行加速计算节点的形函数值、形函数一阶导数值及形函数二阶导数值;并行加速组装总体刚度矩阵K、总体惩罚刚度矩阵Kα和总体质量矩阵M,且以按行压缩存储CSR格式存储于GPU全局存储器中;(3)在CPU中根据设置的时间步长与总时间,读取薄板的节点坐标、作用力以及力作用的时间,依次求得Newmark法每一时间步长下的总体外力向量,并对应存储于总体外力向量矩阵F中,最后由主机内存复制至GPU全局存储器中;(4)读取GPU全局存储器中总体刚度矩阵K和总体惩罚刚度矩阵Kα数据,根据边界条件对总体刚度矩阵进行修正其中,为修正后的总体刚度矩阵;(5)读取GPU全局存储器中总体质量矩阵M、修正后的总体刚度矩阵设置质量比例系数α、刚度比例系数β,在GPU上求解阻尼矩阵C,即(6)设置位移向量矩阵a、速度向量矩阵加速度向量矩阵以及参数α0、δ,并根据参数α0、δ计算积分常数c0、c1、c2、c3、c4、c5、c6、c7;其中,α0=1/4、σ=1/2、c6=Δt(1‑δ)、c7=δΔt,Δt为时间步长;(7)读取GPU全局存储器中修正后的总体刚度矩阵总体质量矩阵M、阻尼矩阵C,在GPU上形成有效刚度矩阵即:并对有效刚度矩阵进行三角分解,即:其中,为有效刚度矩阵,L为三角分解后的下三角矩阵,LT为三角分解后的上三角矩阵;(8)求解每一时间步长(t=0,Δt,2Δt,…)的位移、速度、加速度;其中,t为计算时间,Δt为时间步长;(9)将主机内存中存储的所求节点每一时间步长的位移、速度、加速度的计算结果写入到输出文件中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910212828.6/,转载请声明来源钻瓜专利网。