[发明专利]薄板无网格Galerkin结构动力响应分析的GPU加速方法有效
申请号: | 201910212828.6 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109960865B9 | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 龚曙光;许延坡;卢海山;张建平;左志坚 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F17/16;G06F119/14;G06F117/08 |
代理公司: | 湘潭市汇智专利事务所(普通合伙) 43108 | 代理人: | 宋向红 |
地址: | 411105*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 薄板 网格 galerkin 结构 动力 响应 分析 gpu 加速 方法 | ||
本发明公开了一种薄板无网格Galerkin结构动力响应分析的GPU加速方法。它通过CPU将薄板数据读入到主机内存,根据输入数据计算GPU并行所需相关数据,并将得到的数据复制到GPU全局存储器中;在GPU上设置线程块与线程数量,并行加速计算节点相应的形函数值,然后建立GPU线程块与交叉节点对一一映射模式,并行加速组装薄板的总体刚度矩阵与质量矩阵;在GPU上根据边界条件修正总体刚度矩阵,然后由质量矩阵和修正后的刚度矩阵求得阻尼矩阵、有效刚度矩阵,并将有效刚度矩阵采用三角分解;在GPU中采用Newmark法对薄板进行动力响应分析,最后输出求解的位移、速度和加速度的结果。本发明极大地提高了动力响应分析的求解效率。
技术领域
本发明属于计算机辅助工程中薄板的结构动力仿真分析技术领域,具体涉及一种薄板无网格Galerkin(伽辽金)结构动力响应分析的GPU(GraphicProcessing Unit,图形处理器)加速方法。
背景技术
薄板动力响应分析是研究薄板在动载荷的激励下所产生的位移、速度和加速度等力学参量的动态响应信息,是薄板结构动力设计与灵敏度分析及优化的重要基础之一。在工程中,许多领域都需要采用板壳结构,如车辆、船舶、飞机和压力容器等,然而,这些设备经常处于各种激励的作用,组成部件中的薄板不可避免地产生各种各样的振动。当薄板振动量超出允许范围之后,将会影响设备的工作性能,缩短设备的使用寿命,甚至造成严重的事故。因此,现代工程设计对薄板振动问题的解决提出了更严格的要求。
随着有限元法在工程领域的应用,薄板动力响应可以通过有限元法来模拟分析计算。但有限元法是基于网格的数值方法,网格的质量和尺寸严重影响计算的精度和计算工作量,而且复杂结构的网格生成也极具挑战性。近年来,无网格法得到迅速发展,它不需要划分网格,克服了有限元法对网格的依懒性,在涉及网格畸变时显示出明显优势。目前,无网格Galerkin法是应用最广的无网格计算方法,具有计算精度高、前后处理简便、自适应性好等优点,在结构动力学问题的分析中得到广泛应用。然而薄板的刚度矩阵和质量矩阵的组装耗时长、阻尼矩阵和总体离散系统方程求解速度慢等缺点,严重影响无网格Galerkin法在薄板结构动力分析中的应用。
近年来,随着计算技术和计算机技术的迅猛发展,CPU(Central ProcessingUnit)具有体积小、重量轻结构灵活、价格低廉等优点,但随着晶体管集成工艺进入瓶颈,晶体管密度增长达到物理极限。尽管Intel公司提出了多核CPU,但对CPU提高计算能力帮助有限,与此同时CPU芯片的时钟速率也已经达到了极限,很难再提高。然而,GPU在数据并行处理能力和存储器带宽上逐渐优于CPU,且GPU具有超高的浮点计算能力、性价比高、功耗小等优点,在通用计算领域取得了很大的进展。再者,GPU统一计算设备架构(CUDA)的常用编程模型是直接使用C语言进行开发,大大减少了编程工作。利用CUDA C调用GPU对薄板的刚度矩阵和质量矩阵并行组装,及薄板的阻尼矩阵和总体离散系统方程的求解,极大地提高了结构动力响应分析的计算效率,因此研究基于GPU并行加速的薄板无网格Galerkin法结构动力响应分析具有重要意义。
发明内容
本发明的目的在于针对薄板无网格Galerkin法结构动力响应分析中存在刚度矩阵与质量矩阵组装耗时长、阻尼矩阵和总体离散系统方程求解效率低等问题,提供一种薄板无网格Galerkin结构动力响应分析的GPU加速方法。
本发明的薄板无网格Galerkin结构动力响应分析的GPU加速方法,包括如下顺序的步骤:
(1)通过CPU读取薄板的节点坐标、背景积分网格、材料物理性能、约束条件和动态载荷数据,以及求解设置参数与动力响应的计算时间步长,并存储至主机内存中;在薄板内部和位移边界布置积分点,并求解薄板内部和位移边界上的积分点数据;通过对薄板的节点、积分点循环搜索,确定每个节点影响域内的积分点数据,以及每个积分点定义域内的节点数据;再对薄板的节点循环搜索,确定交叉节点对信息;然后,将薄板内部和位移边界上的积分点数据、交叉节点对信息存储至主机内存中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910212828.6/2.html,转载请声明来源钻瓜专利网。