[发明专利]处理单元、相关装置和张量运算方法有效

专利信息
申请号: 202110588863.5 申请日: 2021-05-28
公开(公告)号: CN113543045B 公开(公告)日: 2022-04-26
发明(设计)人: 范虎;劳懋元;阎承洋;李玉东 申请(专利权)人: 平头哥(上海)半导体技术有限公司
主分类号: H04W4/06 分类号: H04W4/06;H04W28/20;H04W84/08;G06N3/04;G06N3/063;G06N20/00
代理公司: 北京成创同维知识产权代理有限公司 11449 代理人: 李镇江;梁燕飞
地址: 上海市浦东新区中国(上海)自由贸*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 处理 单元 相关 装置 张量 运算 方法
【说明书】:

提供一种处理单元、相关装置和张量运算方法。处理单元包括:多个计算单元,构成n行m列的计算矩阵,n和m是非零的自然数;计算单元控制器,用于在处理单元所处的外部环境带宽满足预定带宽要求的情况下,控制计算矩阵以组播数据输入模式工作,数据按列广播到对应列的所有计算单元,按行广播到对应行的所有计算单元,在外部环境带宽不满足预定带宽要求的情况下,控制计算矩阵以脉动数据输入模式工作,计算单元从前一列同一行的计算单元以及同一列前一行的计算单元接收数据,以支持张量运算。本公开实施例根据处理单元的外部环境带宽灵活配置计算矩阵的工作模式,使得处理单元的外部环境带宽和计算能力适配,提高了处理单元的计算能效。

技术领域

本公开涉及芯片领域,具体而言,涉及一种处理单元、相关装置和张量运算方法。

背景技术

深度学习目前在人脸识别、语音识别、自动驾驶等领域均有广泛的使用。由于深度学习依赖大量的重复的卷积、矩阵运算等张量运算,传统的硬件执行相应的算法效率低,因此,专用于执行其的计算架构应运而生。这些架构中的深度学习处理单元采用由多个计算单元组成的计算矩阵。由计算矩阵中的各计算单元执行卷积、矩阵运算中的元素的运算,然后再将运算结果累加,得到张量运算结果。在计算矩阵中传递待计算张量中的元素的方式一般有脉动数据输入模式和组播数据输入模式。在脉动数据输入模式中,在每个时钟周期,计算矩阵中的计算单元从前一列同一行的计算单元、以及同一列前一行的计算单元接收数据,即数据在每个时钟周期在行的方向和列的方向分别脉动一个计算单元,即传递到行和列的下一个计算单元处。在组播数据输入模式中,在每个时钟周期,数据按列广播到计算矩阵中一列的所有计算单元,数据按行广播到计算矩阵中一行的所有计算单元,即数据在一行或一列的所有计算单元间组播。

深度学习架构的处理单元的性能受限于两个方面:一个是处理单元所处的外部环境带宽,另一个是处理单元的计算能力。对于组播数据输入模式,对带宽要求高,计算单元的处理容易受限于带宽,空闲等待状态多。对于脉动数据输入模式,对带宽要求低,但结构固定,计算不够灵活,在带宽高时不能充分利用带宽。实际使用中,深度学习架构的处理单元面临的外部环境不相同。在外部环境带宽较低时,采用组播数据输入模式无法高效计算,计算单元的空闲等待状态多。在外部环境带宽较高时,采用脉动数据输入模式不能充分利用带宽和资源。这些都造成处理单元的外部环境带宽和计算能力不适配,降低了处理单元的计算能效。

发明内容

有鉴于此,本公开的一个目的是提高处理单元所处外部环境的环境带宽与计算能力的适配度,以提高处理单元的计算能效。

第一方面,本公开实施例提供一种处理单元,包括:

多个计算单元,构成n行m列的计算矩阵,n和m是非零的自然数;

计算单元控制器,用于在所述处理单元所处的外部环境带宽满足预定带宽要求的情况下,控制所述计算矩阵以组播数据输入模式工作,数据按列广播到对应列的所有计算单元,按行广播到对应行的所有计算单元,在所述外部环境带宽不满足预定带宽要求的情况下,控制所述计算矩阵以脉动数据输入模式工作,计算单元从前一列同一行的计算单元以及同一列前一行的计算单元接收数据,以支持张量运算。

可选地,所述预定带宽要求包括:

所述外部环境带宽大于预定环境带宽阈值,所述预定环境带宽阈值是在所述组播数据输入模式下,在一个时钟周期需要输入所述计算矩阵的最大数据总量。

可选地,所述处理单元位于加速单元内,所述加速单元与调度单元共同位于计算装置内,所述加速单元接收所述调度单元的调度执行张量运算,所述外部环境带宽是从所述调度单元接收的指令获得的。

可选地,所述的处理单元,还包括:监测单元,用于监测所述处理单元所处的外部环境带宽。

可选地,所述监测单元实时监测所述外部环境带宽,所述计算单元控制器根据实时监测的所述外部环境带宽,使所述计算矩阵在所述脉动数据输入模式和所述组播数据输入模式之间切换。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平头哥(上海)半导体技术有限公司,未经平头哥(上海)半导体技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110588863.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top