[发明专利]基于GPU集群的城市一般建筑群震害分析的计算加速方法在审

申请号：	201710740626.X	申请日：	2017-08-25
公开（公告）号：	CN107590589A	公开（公告）日：	2018-01-16
发明（设计）人：	许镇;孙韬文;袁静雨	申请（专利权）人：	北京科技大学
主分类号：	G06Q10/06	分类号：	G06Q10/06;G06F9/50
代理公司：	北京市广友专利事务所有限责任公司11237	代理人：	张仲波
地址：	100083***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 gpu 集群城市一般建筑群分析计算加速方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及土木工程防灾减灾技术领域，特别是指一种基于GPU集群的城市一般建筑群震害分析的计算加速方法。

背景技术

在全国660个城市中，位于地震区的占74.5％，约有一半城市位于基本烈度7度及以上地区。城市区域中，绝大多数都是形状简单规则，结构类型明确，地震作用下行为易于预测的一般建筑。这类建筑数量巨大，震害分析的计算量异常庞大，无法满足地震震灾后的快速应急响应要求。因此，为了解决计算效率的问题，需要针对一般建筑群震害分析开发高性能的计算方法。

日本东京大学地震工程研究所的Hori和Ichimura利用超级计算机完成了东京市的震害模拟(Wijerathne M L L,Hori M,Kabeyazawa T,et al.Strengthening of parallel computation performance of integrated earthquake simulation[J].Journal of Computing in Civil Engineering,2012,27(5):570-573.)。然而，超级计算机价格昂贵，维护成本高昂，难以得到广泛应用。

GPU(Graphic Processing Unit，图形处理单元)，最早是用于计算机图形显示的处理单元。由于很好的并行计算和浮点计算能力，GPU开始走出图形计算的限制，将其强大的性能延伸到通用计算的领域。目前，全世界前100强的超级计算机均有GPU参与进行计算，我国也有类似的采用GPU作为运算核心的计算机集群。为此，清华大学韩博等人利用GPU进行城市建筑群的震害分析，并在了7000多建筑群上进行了应用(韩博,陆新征,许镇,李易.基于高性能GPU计算的城市建筑群震害模拟[J].自然灾害学报,2012,21(5):16-22.)。但是，该计算方法限于单个GPU，难以应对更大规模的建筑群。

为此，本发明在GPU加速的基础上，进一步提出基于GPU集群的解决方案，以扩大方法的适用范围，满足城市大规模建筑群的海量计算需求。

发明内容

本发明为解决城市一般建筑群震害分析的海量计算问题，提供一种基于GPU集群的城市一般建筑群震害分析的计算加速方法，实现大规模城市一般建筑震害的快速预测。

该方法包括基于单个GPU的一般建筑震害分析并行计算方法和基于GPU集群的静态负载均衡策略两部分，具体过程如下：

(1)基于单个GPU的一般建筑震害分析并行计算方法：

首先，将计算数据(地震动数据和建筑模型参数)由计算机内存复制到GPU显存中；然后，根据建筑数量开辟GPU线程，每一条线程对应一个建筑计算任务，在GPU中进行求解；最后，将每栋建筑的计算结果由显存复制到内存中。

通过GPU要计算的建筑数量和GPU中的Block数量决定开辟线程的数量。GPU的线程总数等于Block数量与每个Block容纳线程数量的乘积。由于GPU硬件限制，Block容纳线程数量是32的整数倍，一般取256。Block的个数等于要计算的建筑数量除以256后的整数部分确定，如果有余数则加1。则开辟线程的总数等于Block数量乘以256。这样情况下，开辟的线程数量将保证覆盖所有顶点。一个建筑震害分析任务由一条GPU线程负责，采用中心差分法求解动力方程，以完成一栋建筑的震害计算。

(2)基于GPU集群的静态负载均衡策略：

采用一组配有GPU的计算机搭建GPU集群，该组计算机被分为一个Host，余下的为Slaves，采用静态负载均衡策略，评估多自由度剪切层模型的计算荷载；

首先，评估Slave的计算能力，计算能力用每秒的浮点数计算量FLOPS来表示，根据FLOPS值，每个Slave将降序排列，并将它们的编号记为从1到m；

然后，确定所需要的GPU内存M_i＝S_i·M_s，i＝1,2,3,...n，其中，M_s为每个楼层所需的GPU内存，n为建筑的数量，S_i为第i个建筑对应的楼层数；

再通过监控软件测量确定可用的GPU内存大小；

最后，分配任务，将建筑分配到Slave上。任务分配规则是：a)优先给高性能GPU的Slave分配任务；b)每个GPU分配任务总大小应等于或接近GPU可用内存。

本发明的上述技术方案的有益效果如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京科技大学，未经北京科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710740626.X/2.html，转载请声明来源钻瓜专利网。