[发明专利]基于GPU集群的城市一般建筑群震害分析的计算加速方法在审
申请号: | 201710740626.X | 申请日: | 2017-08-25 |
公开(公告)号: | CN107590589A | 公开(公告)日: | 2018-01-16 |
发明(设计)人: | 许镇;孙韬文;袁静雨 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F9/50 |
代理公司: | 北京市广友专利事务所有限责任公司11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gpu 集群 城市 一般 建筑群 分析 计算 加速 方法 | ||
技术领域
本发明涉及土木工程防灾减灾技术领域,特别是指一种基于GPU集群的城市一般建筑群震害分析的计算加速方法。
背景技术
在全国660个城市中,位于地震区的占74.5%,约有一半城市位于基本烈度7度及以上地区。城市区域中,绝大多数都是形状简单规则,结构类型明确,地震作用下行为易于预测的一般建筑。这类建筑数量巨大,震害分析的计算量异常庞大,无法满足地震震灾后的快速应急响应要求。因此,为了解决计算效率的问题,需要针对一般建筑群震害分析开发高性能的计算方法。
日本东京大学地震工程研究所的Hori和Ichimura利用超级计算机完成了东京市的震害模拟(Wijerathne M L L,Hori M,Kabeyazawa T,et al.Strengthening of parallel computation performance of integrated earthquake simulation[J].Journal of Computing in Civil Engineering,2012,27(5):570-573.)。然而,超级计算机价格昂贵,维护成本高昂,难以得到广泛应用。
GPU(Graphic Processing Unit,图形处理单元),最早是用于计算机图形显示的处理单元。由于很好的并行计算和浮点计算能力,GPU开始走出图形计算的限制,将其强大的性能延伸到通用计算的领域。目前,全世界前100强的超级计算机均有GPU参与进行计算,我国也有类似的采用GPU作为运算核心的计算机集群。为此,清华大学韩博等人利用GPU进行城市建筑群的震害分析,并在了7000多建筑群上进行了应用(韩博,陆新征,许镇,李易.基于高性能GPU计算的城市建筑群震害模拟[J].自然灾害学报,2012,21(5):16-22.)。但是,该计算方法限于单个GPU,难以应对更大规模的建筑群。
为此,本发明在GPU加速的基础上,进一步提出基于GPU集群的解决方案,以扩大方法的适用范围,满足城市大规模建筑群的海量计算需求。
发明内容
本发明为解决城市一般建筑群震害分析的海量计算问题,提供一种基于GPU集群的城市一般建筑群震害分析的计算加速方法,实现大规模城市一般建筑震害的快速预测。
该方法包括基于单个GPU的一般建筑震害分析并行计算方法和基于GPU集群的静态负载均衡策略两部分,具体过程如下:
(1)基于单个GPU的一般建筑震害分析并行计算方法:
首先,将计算数据(地震动数据和建筑模型参数)由计算机内存复制到GPU显存中;然后,根据建筑数量开辟GPU线程,每一条线程对应一个建筑计算任务,在GPU中进行求解;最后,将每栋建筑的计算结果由显存复制到内存中。
通过GPU要计算的建筑数量和GPU中的Block数量决定开辟线程的数量。GPU的线程总数等于Block数量与每个Block容纳线程数量的乘积。由于GPU硬件限制,Block容纳线程数量是32的整数倍,一般取256。Block的个数等于要计算的建筑数量除以256后的整数部分确定,如果有余数则加1。则开辟线程的总数等于Block数量乘以256。这样情况下,开辟的线程数量将保证覆盖所有顶点。一个建筑震害分析任务由一条GPU线程负责,采用中心差分法求解动力方程,以完成一栋建筑的震害计算。
(2)基于GPU集群的静态负载均衡策略:
采用一组配有GPU的计算机搭建GPU集群,该组计算机被分为一个Host,余下的为Slaves,采用静态负载均衡策略,评估多自由度剪切层模型的计算荷载;
首先,评估Slave的计算能力,计算能力用每秒的浮点数计算量FLOPS来表示,根据FLOPS值,每个Slave将降序排列,并将它们的编号记为从1到m;
然后,确定所需要的GPU内存Mi=Si·Ms,i=1,2,3,...n,其中,Ms为每个楼层所需的GPU内存,n为建筑的数量,Si为第i个建筑对应的楼层数;
再通过监控软件测量确定可用的GPU内存大小;
最后,分配任务,将建筑分配到Slave上。任务分配规则是:a)优先给高性能GPU的Slave分配任务;b)每个GPU分配任务总大小应等于或接近GPU可用内存。
本发明的上述技术方案的有益效果如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710740626.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种刺绣用多功能面料
- 下一篇:一种改良的橡塑复合环保橡胶地板及制造方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理