[发明专利]一种运算装置和方法在审
申请号: | 202110597369.5 | 申请日: | 2017-06-13 |
公开(公告)号: | CN113449855A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 运算 装置 方法 | ||
本公开提供了一种运算装置,包括:运算模块,包括一个或者多个运算单元;以及控制模块,包括运算控制单元,用于通过一判断条件控制所述运算单元的关闭。本公开还提供了一种运算方法。本公开低功耗运算装置和方法,具有较高的灵活性,能够和软件的提升方式相结合,从而能够进一步提升运算速度,降低计算量,降低加速器的运算功耗。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种运算装置和方法。
背景技术
深度神经网络是目前许多人工智能应用的基础,其在语音识别、图像处理、数据分析、广告推荐系统、汽车自动驾驶等多方面得到了突破性的应用,使得深度神经网络被应用在了生活的各个方面。但是,深度神经网络的运算量巨大,一直制约着其更快速的发展和更广泛的应用。当考虑运用加速器设计来加速深度神经网络的运算时,巨大的运算量,必然会带了很大的能耗开销,同样制约着加速器的进一步的广泛应用。
硬件方面,现有的常用的加速器架构,主要通过分析其运算中耗时最多的运算部分,而后进行针对性的加速设计。以卷积神经网络为例,如图1所示,现有的常见的内积运算的加速结构常常为“乘加”结构,即通过一组乘法器在一个时钟周期获得一组乘积值,而后,并行进行累加,得到最终结果。然而,这种结构,灵活性不高,无法进一步提升运算速度,降低计算量。
发明内容
(一)要解决的技术问题
为了解决或者至少部分缓解上述技术问题,本公开提供了一种低功耗运算装置和方法。本公开低功耗运算装置和方法,具有较高的灵活性,能够和软件的提升方式相结合,从而能够进一步提升运算速度,降低计算量,降低加速器的运算功耗。
(二)技术方案
根据本公开的一个方面,提供了一种运算装置,包括:
运算模块,包括一个或多个运算单元;以及
控制模块,包括运算控制单元,用于根据一判断条件控制所述运算模块的运算单元的关闭。
在一些实施例中,每个所述运算单元包括一个或多个运算部件,该运算部件为加法器、乘法器、选择器或临时缓存器。
在一些实施例中,所述运算模块包括位于第一级的n个乘法器以及位于第二级的n输入的加法树,其中n为正整数。
在一些实施例中,所述判断条件包括阈值判断条件或函数映射判断条件。
在一些实施例中,所述判断条件为阈值判断条件,包括:小于一给定阈值,大于一给定阈值,在一给定取值范围内或在一给定取值范围外。
在一些实施例中,所述判断条件为函数映射判断条件,即判断经函数变换后是否满足给定条件。
在一些实施例中,所述第一级的n个乘法器分别与运算控制单元连接,该运算控制单元根据所述判断条件控制所述乘法器的关闭。
在一些实施例中,该运算控制单元根据所述判断条件对待运算的数据进行判断,当其判断输入一乘法器的输入数据的绝对值小于给定的阈值时,则关闭该乘法器。
在一些实施例中,所述加法树包括k级加法器,第一级加法器的个数为n/2,最后一级即第k级加法器的个数为1个,其中2k=n;所述加法树的第1级的n/2个加法器与所述n个乘法器连接,接收乘法器发送的数据信号和控制信号;加法树的第2至第k级加法器分别与其前1级加法器连接,接收前1级加法器发送的数据信号和控制信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597369.5/2.html,转载请声明来源钻瓜专利网。