[发明专利]核函数生成方法、装置、设备以及存储介质在审
申请号: | 202110665158.0 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113485798A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 肖熠;霍志坤;李志功 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F17/16 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 孙立波 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 函数 生成 方法 装置 设备 以及 存储 介质 | ||
本申请公开了一种核函数生成方法、装置、设备以及存储介质,该方法包括:获取到核函数配置信息后,根据目标计算节点的数量N分别对核函数配置信息包括的M个矩阵维度区间进行拆分,得到多个矩阵维度子区间,根据多个矩阵维度子区间和核函数配置信息包括的每个矩阵维度区间对应的参数空间,构建N个核函数生成任务,将N个核函数生成任务和核函数运行文件分发给N个目标计算节点,用于每个目标计算节点根据核函数生成任务和核函数运行文件,生成至少一个矩阵维度对应的核函数,对每个目标计算节点发送的至少一个矩阵维度对应的核函数进行合并,得到多个矩阵维度和每个矩阵维度对应的核函数。从而,可降低生成核函数的时间和计算复杂度。
技术领域
本申请涉及计算机技术领域,尤其涉及一种核函数生成方法、装置、设备以及存储介质。
背景技术
在现代高性能计算机中,以异构加速器为主要计算单元的高性能计算机体系结构逐渐成为主要结构,异构加速器可以有效提供高浮点计算性能,功耗还较低。线性系统软件包(Linear system package,Linpack)是评价高性能计算机的浮点计算性能峰值的主要标准,而高性能线性系统软件包(High Performance Linpack,HPL)是目前国际主要采用的基准测试程序,是目前大规模和超大规模集群的测试标准。在高性能计算机上,HPL使用高斯消元法或迭代法求解N元一次稠密线性代数方程组,以此评价高性能计算机的浮点计算性能。HPL中的一部分程序在CPU上运行,HPL中的另一部分程序在异构加速器上运行,运行在异构加速器上的该部分程序中,计算量最多的部分程序是双精度通用矩阵乘法(Generalmatrix multiply gemm,GEMM)和双精度三角求解(triangular solve,TRSM)对应的程序,双精度GEMM和双精度TRSM对应的程序分别对应一个核函数,每个核函数需要采用显式或隐式的方式编写。目前,由于异构加速器微体系结构不同,相同算法在不同异构加速器上实现的效率往往有较大差异,通常需要使用自动生成代码技术生成核函数。
Tensile是现有的一种核函数生成器,可生成GEMM核函数和TRSM核函数,相关技术中,在通过Tensile生成核函数时,具体是先根据预设的矩阵维度区间(包括矩阵的行和列的取值区间)和预设的参数空间构建测试文件,其中的参数空间包括多个参数和每个参数的取值区间,在构建测试文件时,具体是针对矩阵维度区间确定多个矩阵维度,对每一矩阵维度,根据该矩阵维度和参数空间构建该矩阵维度对应的测试文件,每个测试文件包括矩阵维度、参数空间中的每个参数以及每个参数的取值,然后再根据该矩阵维度对应的测试文件生成多个核函数,并运行Benchmark算例测试每个核函数的性能,将其中性能最优的核函数确定为该矩阵维度对应的核函数,最终为所确定的每个矩阵维度生成一个核函数。
上述核函数的生成过程中,由于参数空间中包括至少十种不同参数,每一参数的取值区间也不同,在根据一个矩阵维度和参数空间构建该矩阵维度对应的测试文件时,所需时间较长,在矩阵维度区间较大时,随着所确定的矩阵维度的个数增加,所需的总的时间进一步增加;而且,在根据测试文件生成多个核函数,并测试每个核函数的性能时,由于测试文件的数量较多,导致计算复杂度也较高。总之,根据预设的矩阵维度区间和预设的参数空间生成核函数的时间较长、计算复杂度较高。
发明内容
本申请提供一种核函数生成方法、装置、设备以及存储介质,以解决生成核函数的时间较长、计算复杂度较高的问题。
第一方面,本申请提供一种核函数生成方法,包括:
获取到核函数配置信息后,根据目标计算节点的数量N分别对M个矩阵维度区间进行拆分,得到多个矩阵维度子区间,其中,所述核函数配置信息包括所述M个矩阵维度区间和每个所述矩阵维度区间对应的参数空间,所述M|和所述N为大于或等于1的正整数;
根据所述多个矩阵维度子区间和每个所述矩阵维度区间对应的参数空间,构建所述N个核函数生成任务,每个所述核函数生成任务包括至少一个矩阵维度子区间和每个矩阵维度子区间对应的参数空间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110665158.0/2.html,转载请声明来源钻瓜专利网。