[发明专利]一种高性能服务器GPU性能瓶颈调优方法、装置及存储介质有效
申请号: | 202010804248.9 | 申请日: | 2020-08-11 |
公开(公告)号: | CN112000472B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 赵阳阳;段谊海 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/34;G06T1/40 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 朱晓熹 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 性能 服务器 gpu 瓶颈 方法 装置 存储 介质 | ||
1.一种高性能服务器GPU性能瓶颈调优方法,其特征在于,包括:
配置GPU设定计算性能,并保存于第三文件,配置服务器指标的阈值,保存于第四文件;
GPU执行算例,跟踪执行算例过程中处理函数的调用,记录处理函数及其起始终止时间,通过处理函数及其起始终止时间计算得到GPU实际计算性能:获取特定时刻运行的处理函数,调取每个处理函数的启动运算块的数量和处理函数每个运算块中的线程数量,计算每个处理函数的线程数目;对每个处理函数的线程数目求和获取GPU运行的线程数量,通过特定时刻GPU运行的线程数量计算GPU实际计算能力并记录于第一文件中;
执行算例过程中,采集并记录GPU相关的服务器指标的数据,所述服务器指标的数据记录于第二文件,其中,所述服务器指标数据包括服务器CPU利用率、服务器内存利用率、PCIE带宽以及NVLINK收发速率;
根据第一文件、第二文件、第三文件以及第四文件的数据对比服务器指标的数据与服务器指标的阈值,判断当前GPU参数是否适配服务器;
对比GPU实际计算性能与设定计算性能,若实际计算性能小于设定计算性能,通过参数优化算法调整GPU参数,所述参数优化算法向服务器和GPU之间的GPU参数配置接口输出GPU参数,所述GPU参数配置接口将GPU参数配置到GPU。
2.根据权利要求1所述的高性能服务器GPU性能瓶颈调优方法,其特征在于,采集并记录GPU相关的服务器指标的数据,所述服务器指标的数据记录于第二文件包括:通过周期性的调用存储在方法文件或者寄存器中的服务器指标数据,并将获取服务器指标数据与获取所述服务器指标数据的时间记录于所述第二文件中。
3.根据权利要求1所述的高性能服务器GPU性能瓶颈调优方法,其特征在于,所述GPU参数包括内存频率、核心时钟频率、最大功率限制、以及计算模式。
4.根据权利要求1所述的高性能服务器GPU性能瓶颈调优方法,其特征在于,所述参数优化算法包括内存频率优化算法、核心时钟频率优化算法以及最大功率限制优化算法;所述内存频率优化算法输出内存频率参数、所述核心时钟频率优化算法输出核心时钟频率参数,最大功率限制优化算法输出最大功率限制参数。
5.根据权利要求4所述的高性能服务器GPU性能瓶颈调优方法,其特征在于,内存频率优化算法调整内存频率向使GPU性能更优的方向进行,过程中遇到GPU性能下降随即采用二分算法确定最优的内存频率;核心时钟频率优化算法调整核心时钟频率向使GPU性能更优的方向进行,过程中遇到GPU性能下降随即采用二分算法确定最优的核心时钟频率;以及最大功率限制优化算法调整最大功率限制向使GPU性能更优的方向进行,过程中遇到GPU性能下降随即采用二分算法确定最优的内存频率。
6.一种高性能服务器GPU性能瓶颈调优装置,其特征在于,包括处理单元(701)、存储单元(702)、总线单元(703)以及接口单元(704),所述处理单元(701)、所述存储单元(702)和所述接口单元(704)连接于所述总线单元,所述存储单元(702)保存至少一条指令,所述指令被处理单元执行时能够实现权利要求1-5任一高性能服务器GPU性能瓶颈调优方法。
7.一种存储介质,其特征在于,所述存储介质保存至少一条指令,所述指令被处理器执行时,能够实现权利要求1-5任一高性能服务器GPU性能瓶颈调优方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010804248.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带末端力反馈的柔性机械臂
- 下一篇:一种从鸭胆汁中分离鹅去氧胆酸的方法