[发明专利]面向异构融合体系结构的矩阵乘加速方法有效

专利信息
申请号: 201910076766.0 申请日: 2019-01-27
公开(公告)号: CN109871512B 公开(公告)日: 2020-05-22
发明(设计)人: 甘新标;曾瑞庚;杨志辉;孙泽文;吴涛;刘杰;龚春叶;李胜国;杨博;徐涵;晏益慧 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F17/16 分类号: G06F17/16;G06F7/523
代理公司: 长沙中科启明知识产权代理事务所(普通合伙) 43226 代理人: 任合明
地址: 410003 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 融合 体系结构 矩阵 加速 方法
【说明书】:

发明公开了一种面向异构融合体系结构的矩阵乘加速方法,目的是面向不同的众核加速器目标体系结构设计一种通用的面向异构融合体系结构矩阵乘加速方法,提高异构系统使用效率。技术方案是先设计面向异构融合体系结构的分块矩阵乘版本,包括vcpu、vgpu、vmic,vscif,vcoi,vtarget,然后对这些异构融合多版本矩阵乘版本集成打包生成异构融合版本的库文件HU‑xgemm;最后用HU‑xgemm适配异构融合体系结构中的加速器。本发明能够自适应不同的目标加速器和处理器,能根据不同的异构融合体系结构自适应地进行矩阵乘,且根据不同的异构融合体系结构中CPU或加速器的拓扑结构进行矩阵乘,各FMA并行计算,加快了矩阵乘速度,提高了异构系统使用效率。

技术领域

本发明涉及矩阵乘加速方法,尤指面向异构系统的异构融合体系结构矩阵乘加速方法。

背景技术

随着通用加速器计算性能的不断攀升和加速器的广泛应用,众核加速器必将成为高性能计算重要的发展方向,涌现出GPU、MIC(Xeon Phi)、Matrix2000等满足各领域需求的加速器。随着异构系统的广泛应用和普及,涌现出以CPU+GPU,CPU+MIC,CPU+Matrix2000等众多不同类型的异构体系结构。

加速器的设计目标和设计原则决定了加速器的专用性和局限性,不同加速器厂商开发了与之适应的的编程模型,如GPU支持的CUDA,MIC支持的Offload,Matrix2000支持的COI(Coprocessor Offload Infrastructure)、SCIF(Symmetric CommunicationsInterface)、OpenMP target等编程模型。面向目标加速器的程序设计必须采用其支持的编程模型重新设计并实现算法,才有可能加速;如果不依照加速器支持的编程模型对程序进行重新设计并实现,程序基本不可能运行,更不会有加速效果。因此,针对不同的异构系统需要设计实现不同版本的程序,如面向CPU+GPU异构系统必须实现能够在CPU与GPU之间高效协同的算法和程序;面向CPU+MIC必须实现能够在CPU与MIC之间高效协同的算法和程序;面向CPU+Matrix2000必须实现能够在CPU与Matrix2000之间高效协同的算法和程序。随着异构系统加速器的更新替换和升级,不同时期需要重新设计实现面向不同加速器版本的程序,甚至可能出现一套异构系统中同时出现多种加速器混合使用的情形时需要同时设计面向不同目标加速器的算法和程序。

面向不同的异构系统,软件设计人员需要重新理解目标体系结构和学习新的编程模型来实现已有的算法,花费大量的时间来学习新知识去重复已有的工作,效果可能还不好,也不利于专注领域算法设计与开发。因此,设计一套通用的程序能运行于不同异构系统上,将极大解放程序设计人员,提高开发效率。

矩阵乘是数值计算中最常用的一类操作,很多应用中都包含矩阵乘的计算过程,提高了矩阵乘的运算速度,就能很大程度提高高性能计算的速度。

矩阵乘是将被乘矩阵A的一行和乘数矩阵B的一列相乘得到结果矩阵C中的一个元素。面向异构系统的矩阵乘法通常需要将矩阵乘计算过程合理分布在主处理器(CPU)和众核加速器之间异构协同并行完成计算过程,以提高矩阵乘的运算速度和最大化异构系统的计算效率和使用效率。

由于众核加速器设计目标和指令集结构的不同,传统的面向通用主处理器的矩阵乘实现技术很难满足面向特定应用而设计的众核加速器的性能要求,因此,必须面向众核加速器目标体系结构对矩阵乘进行加速以提高矩阵乘的运算速度,最大限度满足异构系统设计目标。

若能面向CPU+GPU、CPU+MIC、CPU+Matrix2000等多种异构系统提供异构融合矩阵乘加速方法以屏蔽目标体系结构细节,简化异构系统程序开发,提高异构系统效率,使得程序员能最大限度专注于领域算法设计与开发,而不需要了解异构系统具体的结构和指令,将有力解决众核加速器在高性能计算领域发展制约,是本领域技术人员亟需解决的技术难题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910076766.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top