[发明专利]一种矩阵计算的方法、系统及编译器在审
申请号: | 202110589381.1 | 申请日: | 2021-05-28 |
公开(公告)号: | CN115407976A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 许利霞;郭海涛;郑卫炎;杨仲凯;季晨鹏;刘洪广 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F8/30 | 分类号: | G06F8/30;G06F9/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 刘金玲 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 矩阵 计算 方法 系统 编译器 | ||
1.一种矩阵计算的方法,其特征在于,应用于矩阵计算的系统,所述系统包括编译器和至少一个用于矩阵计算的硬件;
所述方法包括:
所述编译器获取矩阵计算的源代码,所述源代码包括导语以及矩阵计算任务,所述导语用于指示生成所述矩阵计算任务的文件;
所述编译器获取所述矩阵计算任务的编译类型;
所述编译器根据所述编译类型从所述至少一个用于矩阵计算的硬件中确定执行所述矩阵计算任务的目标硬件;
所述编译器根据所述导语生成所述矩阵计算任务的文件,并将所述文件发送至所述目标硬件;
所述目标硬件根据所述文件执行所述矩阵计算任务。
2.根据权利要求1所述的方法,其特征在于,所述编译器根据所述编译类型从所述至少一个矩阵计算的硬件中确定执行所述矩阵计算任务的目标硬件,包括:
所述编译器根据预设的策略从满足所述编译类型的硬件中选择用于执行所述矩阵计算任务的目标硬件;或者
所述导语包括用于指示执行所述矩阵计算任务的硬件的指示信息,所述编译器根据所述指示信息和所述编译类型确定用于执行所述矩阵计算任务的目标硬件。
3.根据权利要求2所述的方法,其特征在于,所述编译器根据预设的策略从满足所述编译类型的硬件中选择用于执行所述矩阵计算任务的目标硬件,包括:
所述编译器根据每个满足所述编译类型的硬件的计算能力和/或当前负载,从满足所述编译类型的硬件中选择用于执行所述矩阵计算任务的硬件。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述执行所述矩阵计算任务的硬件,包括主机或与所述主机连接的硬件。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述硬件包括以下一种或多种:加速卡,图形处理器GPU,神经网络处理器NPU,张量处理单元TPU。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述导语基于OpenMP或OpenACC实现。
7.一种矩阵计算系统,其特征在于,包括编译器和至少一个用于矩阵计算的硬件;
所述编译器,用于获取矩阵计算的源代码,所述源代码包括导语以及矩阵计算任务,所述导语用于指示生成所述矩阵计算任务的文件;获取所述矩阵计算任务的编译类型;根据所述编译类型从所述至少一个用于矩阵计算的硬件中确定执行所述矩阵计算任务的目标硬件;根据所述导语生成所述矩阵计算任务的文件,并将所述文件发送至所述目标硬件;
所述目标硬件根据所述文件执行所述矩阵计算任务。
8.根据权利要求7所述的系统,其特征在于,所述编译器,在根据所述编译类型从所述至少一个矩阵计算的硬件中确定执行所述矩阵计算任务的目标硬件时,具体用于:
根据预设的策略从满足所述编译类型的硬件中选择用于执行所述矩阵计算任务的目标硬件;或者
所述导语包括用于指示执行所述矩阵计算任务的硬件的指示信息,根据所述指示信息和所述编译类型确定用于执行所述矩阵计算任务的目标硬件。
9.根据权利要求8所述的系统,其特征在于,所述编译器,在根据预设的策略从满足所述编译类型的硬件中选择用于执行所述矩阵计算任务的目标硬件时,具体用于:
根据每个满足所述编译类型的硬件的计算能力和/或当前负载,从满足所述编译类型的硬件中选择用于执行所述矩阵计算任务的硬件。
10.根据权利要求7-9任一项所述的系统,其特征在于,所述执行所述矩阵计算任务的硬件,包括主机或与所述主机连接的硬件。
11.根据权利要求7-10任一项所述的方法,其特征在于,所述硬件包括以下一种或多种:加速卡,图形处理器GPU,神经网络处理器NPU,张量处理单元TPU。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110589381.1/1.html,转载请声明来源钻瓜专利网。