[发明专利]一种表征高性能计算应用特征的方法有效
申请号: | 201210398976.X | 申请日: | 2012-10-19 |
公开(公告)号: | CN102945198A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 刘羽;金莲;吕文静;于涛 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表征 性能 计算 应用 特征 方法 | ||
技术领域
本发明涉及高性能计算领域在应用软件性能表征方面的内容,具体涉及一种利用监视和提取合适的高性能参数,最合理的反映大规模应用软件对计算资源需求的方法。
背景技术
随着人类社会的不断进步,科学技术的发展,人们不但对自然界的认识越来越广泛,而且对未知世界探索的需求也越来越迫切。这就使得人类撑握的信息数据的量急剧性的增长,而与时同时,这些海量的信息数据都需要及时的分析和处理。例如,一个大型天文射电望远镜阵列一秒钟就能产生100GB以上的宇宙微波数据,这些数据都需要及时得到分析;再如,在粒子物理研究领域,一台大型强子对撞机一次对撞的数据也是以TB为单位来计量的;此外,像人类基因组工程、石油勘探、天气预报等等领域也对计算能力提出了越来越高的要求。在这种大背景下数值计算已然成为了除实验、理论分析之外的第三种极其重要的科学探索手段。正是基于这样的现实,促使了当今世界各个科技强国都在不遗余力的大力发展超级计算机。如,在2012年6月发布的世界TOP500中,排名第一的IBM“红杉(Sequoia)”就已经达到了20PFlops的峰值速度,而与此同时新的百亿亿次超级计算机也已经在研究和规划之中了。总的来说,基本上每十年,超级计算机的速度就提升三个量级(1000倍),因此建造超级计算机的能力已经成为一个国家科技水平和综合国力的一个有力体现。
虽然超级计算机发展的速度是惊人的,也令人欣慰,但很遗憾的是与之相配套的软件技术却裹足不前,这已经严重的制约了超级计算机应用能力的发挥。现在绝大多数的应用软件所基于的基本原理和数学算法,还是上世纪50~60年代提出和发展起来的,这些算法与当时的大型机是完全匹配和适应的,以串行或少量进程间并行为主。但经过50多年的发展,现在的超级计算机体系结构已经发生了翻天覆地的变化,动辄拥有几十万乃至上百万的CPU核,而且还有相当一部分超级计算机是使用的混合异构(CPU+GPU/MIC等)的体系架构,这就使得早期的物理模型和数学算法力不从心、无法胜任。这就是现在绝大多数的应用软件效率低下、可扩展性差的主要原因。
要破解现在的这些难题,一方面,我们应该大力研究和发展新的与现今超级计算机体系结构相匹配的物理模型和数学算法,这是突破现有瓶颈的终极手段,但这毕竟是一项极其困难的课题,无法在短时间内见到成效并实现大规模应用;另一方面,我们应着手研究现在所继承下来的、海量的应用软件,合理的表征它们的运行特征,找出它们的性能瓶颈,最大限度的在现有平台上发挥这些应用的性能,此外还能为应用性能的改进和突破提供有力的依据。因此,如何合理、科学的表征应用的特征就是本发明所要解决的主要问题。
发明内容
本发明的目的是提供一种表征高性能计算应用特征的方法。
本发明的目的是按以下方式实现的,本发明要解决的技术问题是设计一种快速、高效的表征高性能计算中应用程序运行特征的方法,从而迅速、精确的定位应用程序对计算资源的需求量,最大限度的发挥应用程序的性能。
针对现行高性能计算机体系架构及计算应用的特点,将对应用运行特征的表征过程大体划分为两个主要步骤,即,1)为应用程序运行对计算资源占用的监控和数据提取,2)为对所采集数据的分析和后处理,对于前者,根据高性能计算平台的架构特点,从后台运行监控器,实现对应用程序计算资源占用情况的实时监控,并提取数据,它不但要针对不同架构的硬件平台,更要求监控器对资源的占用微乎其微,不能影响到被监控程序的正常运行;而对于后者,根据硬件平台的特点设定合理的参照量,从所监控的海量数据中选取合适的参照量进行分析,以定位应用程序对计算资源的需要水平,要求有统一标准的对海量数据的分析处理能力;具体分析、组织流程如下:
1)确定软、硬件平台:是指根据所要表征的应用软件,选择合适的硬件平台,并部署好相应的系统、数学库、监控器等软件环境,在这里硬件平台的性能应尽可能的平衡,并且尽可能的留有一定的资源余量;
2)运行监控器:是指在流程1)中所部署好的硬件平台上,在主、从节点分别运行资源监控器;这里资源监控器应满足从所有的计算节点上实时监控应用资源占用量的功能,包括但不限于CPU使用率、内存占用量、实时IO带宽、网络吞吐,它应用完整涵盖所监测硬件平台的所有资源;
3)从节点向主控节点发送监控数据:主控节点和从节点是针对监控来说的,它是一个相对的概念,主控节点亦可同时是从节点,它主要完成对监控数据的接收,而从节点则是监控自身资源占用情况并负责向主控节点发送监控数据,如果主控节点没有正常接收到数据就需要返回流程1),以重新确定软、硬平台的状态可用;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210398976.X/2.html,转载请声明来源钻瓜专利网。