[发明专利]基于异构平台的自适应节点融合编译优化方法有效

专利信息
申请号: 201910885756.1 申请日: 2019-09-19
公开(公告)号: CN112527304B 公开(公告)日: 2022-10-04
发明(设计)人: 王飞;沈莉;吴伟;胡浩;钱宏 申请(专利权)人: 无锡江南计算技术研究所
主分类号: G06F8/41 分类号: G06F8/41;G06F16/901;G06K9/62
代理公司: 苏州创元专利商标事务所有限公司 32103 代理人: 王健
地址: 214083 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 平台 自适应 节点 融合 编译 优化 方法
【说明书】:

发明公开一种基于异构平台的自适应节点融合编译优化方法,包括以下步骤:S1、生成中间表示;S2、DAG融合子图识别;S3、节点融合策略;S4、代价评估;S5、自适应选择节点融合策略,即根据S4计算得到的第k个融合策略代价,结合目标后端的寄存器、cache、内存使用情况,自适应地选择最优的节点融合策略;S6、目标相关节点融合,根据节点融合策略,将S23中匹配得到的DAG子图的控制流和数据流关系,转移到S5选择出的节点融合策略所生成的融合后的DAG子图上,使用融合后的DAG子图替换融合前的DAG子图,转到S22;S7、生成目标代码,即编译器对降级完成后的DAG进行编译处理,生成异构平台代码。本发明为异构平台的节点融合优化提供精确指导,能够进一步挖掘异构平台复合指令的潜力,提升异构平台的性能。

技术领域

本发明涉及一种基于异构平台的自适应节点融合编译优化方法,属于编译器优化技术领域。

背景技术

精简指令集计算机和复杂指令集计算机是当前CPU的两种架构,它们的区别在于不同的CPU设计理念和方法。早期的CPU全部是复杂指令集架构,它的设计目的是要用最少的机器语言指令来完成所需的计算任务。长期以来,计算机的性能的提高往往是通过增加硬件的复杂性来获得,一般的复杂指令计算机所含的指令数目至少300条,有的甚至超过了500条。复杂指令集计算机虽然能带来较大的性能提升,但是对于一个典型的程序而言,其运算过程所使用的80%指令只占一个处理器指令系统的20%,由此可见指令和成本之间存在巨大的不平衡。此外,尽管超大规模集成电路技术现在已经达到很高的水平,但也很难把复杂指令集计算机的全部硬件做在一个芯片上,这也妨碍单片计算机的发展。精简指令集系统只包含那些使用频繁的指令,并提供一些必要的指令以支持操作系统和高级语言。使用精简指令集的计算机不仅制造工艺简单而且成本低廉。

复合指令是在基础的精简指令集的基础之上,增加的一些用于提升程序性能、增加指令并行度的特殊指令。可以说复合指令的出现标志着精简指令集计算机和复杂指令计算机正在逐渐走向融合,比如常见的复合指令——乘加指令就是由专门的乘加器来完成乘加运算,对于一些机器学习、科学计算的课题而言,乘加指令使用得相当频繁。如神经网络中最常见的表达式y = x × w + b可以通过乘加指令来完成,表达式中x为[x1,x2,…,xn],w为[w1,w2,…,wn]T, b为一个常量。当然还有其他的一些复合指令来针对某些课题进行加速,所以通过使用复合指令可以进一步释放CPU的潜力,提升CPU的性能。复合指令是通过专用的硬件逻辑来完成复杂的功能,相比于软件实现,硬件实现效率更高。该类指令被广泛用于提升课题执行效率上,且达到很好的加速效果。

传统的编译器所采用的节点融合优化技术主要都是通过在源代码中调用内建函数接口或用中间表示进行模板匹配等方式来生成复合指令。内建函数调用方式与后端指令信息是强相关的,这在一定程度上限制了目标无关的节点优化,不利于编译器优化技术的发展,而且增加了程序员开发程序的复杂度。模板匹配方式生成复合指令是通过匹配一个子图然后替换为相应的复合指令,这种方式没有充分考虑指令集、数据流和控制流信息对复合指令的影响,导致生成的可执行文件的无法充分发挥复合指令的性能,不利于处理器复合指令性能的充分提升。该类方式的优点是简单且易于实现,但是没有充分考虑后端特征和当前数据流等信息,导致生成的指令序列不能达到所期待的加速效果,甚至还可能导致倒加速,极大地限制了复合指令的性能。

发明内容

本发明的目的是提供一种基于异构平台的自适应节点融合编译优化方法,该基于异构平台的自适应节点融合编译优化方法为异构平台的节点融合优化提供精确指导,能够进一步挖掘异构平台复合指令的潜力,提升异构平台的性能。

为达到上述目的,本发明采用的技术方案是:一种基于异构平台的自适应节点融合编译优化方法,包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910885756.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top