[发明专利]一种稠密卷积运算核心的低功耗方法在审

申请号：	202110453264.2	申请日：	2021-04-26
公开（公告）号：	CN114217686A	公开（公告）日：	2022-03-22
发明（设计）人：	林蓉芬;袁欣辉;尹万旺;魏迪;王飞;孙浩男;孙强;史俊达	申请（专利权）人：	无锡江南计算技术研究所
主分类号：	G06F1/3234	分类号：	G06F1/3234;G06F7/483;G06F17/15
代理公司：	苏州创元专利商标事务所有限公司 32103	代理人：	王健
地址：	214038 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种稠密卷积运算核心功耗方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种稠密卷积运算核心的低功耗方法，包括以下步骤：S1、分析平台指令特点，得到指令流数据重用高的数据存储格式P；S2、判断卷积输入数据是否为P存储格式，如果是，则跳转到S3；S3、将输入数据整理成P存储格式；S4、在指令级通过数据重用调用P存储格式的运算核心进行运算。本发明在不损失高功耗课题效率的同时，显著降低了对存储部件的数据访存频次，从而降低存储部件数据访问的功耗，进而显著降低高功耗课题的CPU运行功耗，缓解功耗墙难题、节约能耗。

技术领域

本发明涉及一种稠密卷积运算核心的低功耗方法，属于低功耗算法优化技术领域。

背景技术

卷积是深度学习中最重要的概念之一，整个卷积神经网络的训练和推理过程中，卷积操作占据了绝大部份的计算量，高性能计算平台通常要针对这类核心运算提供专门的解决方案。但是，在算法设计上，大家关注的都是如何保证卷积运算的高效实现，对于如何在高效实现的基础上维持低功耗运行，目前是个空白。

CPU的运行功耗主要来源于浮点部件的翻转、存储部件的数据访问以及其他各部件的运行消耗。其中，浮点部件的翻转占据运行功耗的45%以上，存储部件的数据访问功耗占据运行功耗的35%左右，其他部件的运行功耗在20%左右。功耗墙是CPU运行时面临的问题之一，低功耗运行有利于芯片的稳定，对节约能耗也有重要的意义，特别是高功耗课题对CPU的稳定运行具有很大的挑战。

发明内容

本发明的目的是提供一种稠密卷积运算核心的低功耗方法，以缓解功耗墙难题。

为达到上述目的，本发明采用的技术方案是：提供一种稠密卷积运算核心的低功耗方法，包括以下步骤：

S1、分析平台指令特点，得到指令流数据重用率高的数据存储格式P；

S2、判断卷积输入数据是否为P存储格式，如果是，则跳转到S4；

S3、将卷积输入数据整理成P存储格式；

S4、在指令级通过数据重用调用P存储格式的运算核心进行运算。

由于上述技术方案的运用，本发明与现有技术相比具有下列优点：

本发明一种稠密卷积运算核心的低功耗方法，通过数据布局的改变，提高数据在寄存器的复用率，在不损失高功耗课题效率的同时，显著降低了对存储部件的数据访存频次，从而降低存储部件数据访问的功耗，进而显著降低高功耗课题的CPU运行功耗，缓解功耗墙难题、节约能耗。

附图说明

附图1为发明一种稠密卷积运算核心的低功耗方法的核心指令排布图。

具体实施方式