首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]用于张量置换引擎的装置和方法在审

申请号：	201910456393.X	申请日：	2019-05-29
公开（公告）号：	CN110659068A	公开（公告）日：	2020-01-07
发明（设计）人：	B·埃金	申请（专利权）人：	英特尔公司
主分类号：	G06F9/312	分类号：	G06F9/312;G06F9/315;G06F9/30;G06F9/345
代理公司：	31100 上海专利商标事务所有限公司	代理人：	何焜;黄嵩泉
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据元素寄存器读取地址区块写入地址写入读取移位寄存器存储装置生成单元混洗组接收引擎置换自由
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种用于张量置换引擎的装置和方法。所述TPE可以包括读取地址生成单元(AGU)和写入AGU，所述读取地址生成单元用于生成第一存储装置中的多个张量数据元素的多个读取地址，所述写入AGU用于生成所述第一次存储装置中的所述多个张量数据元素的多个写入地址。所述TPE可以包括混洗寄存器区块，所述混洗寄存器区块包括用于从由所述读取AGU生成的所述多个读取地址读取张量数据元素的寄存器、用于接收所述张量数据元素的第一寄存器区块和用于从所述第一寄存器区块中的每个组接收最低张量数据元素的移位寄存器，所述移位寄存器中的每个张量数据元素被写入来自由所述写入AGU生成的所述多个写入地址的写入地址。

背景技术

技术领域

本发明的实施例总体上涉及计算机处理器领域。更具体地，实施例涉及用于数据表示之间进行连贯的加速转换的装置和方法。

相关技术说明

张量在机器学习工作负载中是常见的，用于在例如神经网络中的层之间传递数据。当张量在层之间传递时，其可以被重新安排。例如，可以变换或旋转四维或五维张量，使得新格式更好地匹配下一层。同样，在反向传播时，在不首先旋转张量的情况下访问所述张量可能导致跨步访问，因为元素在不同维度中被访问。

过去，可以使用各种向量指令来执行这种变换。然而，考虑到在使用中的一些张量的大小，以及在任何给定指令中可以旋转的有限量的数据，这可能导致大量的指令调用，从而导致显著的开销。另外，这种指令通常使用分散/聚集方法来收集正在旋转的元素，导致大量的跨步数据访问，从而当数据在高速缓存行和/或核之间移动时导致附加开销。

附图说明

可以结合以下附图从以下详细描述中获得对本发明的更好的理解，在附图中：

图1A和图1B是框图，展示了根据本发明的实施例的通用向量友好指令格式及其指令模板；

图2A至图2C是框图，展示了根据本发明的实施例的示例性VEX 指令格式；

图3是根据本发明的一个实施例的寄存器架构的框图；并且

图4A是框图，展示了根据本发明的实施例的示例性有序取出、解码、引退流水线和示例性寄存器重命名、乱序发布/执行流水线两者；

图4B是框图，展示了根据本发明的实施例的有序取出、解码、引退核的示例性实施例和有待包括在处理器中的示例性寄存器重命名、乱序发布 /执行架构核两者；

图5A是单个处理器核连同其与管芯上互联网络的连接的框图；

图5B展示了根据本发明的实施例的图5A中的处理器核的一部分的展开图；

图6是根据本发明的实施例的具有集成存储器控制器和图形的单核处理器和多核处理器的框图；

图7展示了根据本发明的一个实施例的系统的框图；

图8展示了根据本发明的实施例的第二系统的框图；

图9展示了根据本发明的实施例的第三系统的框图；

图10展示了根据本发明的实施例的芯片上系统(SoC)的框图；

图11展示了根据本发明的实施例的对照使用软件指令转换器来将源指令集中的二进制指令转换为目标指令集中的二进制指令的框图；

图12展示了根据实施例的可以在其上实施实施例的处理器架构。

图13展示了根据实施例的地址生成单元；

图14示出了根据实施例的用于二维张量旋转的位混洗单元配置的示例；

图15示出了根据实施例的生成写入计数器位置换的示例；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于英特尔公司，未经英特尔公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910456393.X/2.html，转载请声明来源钻瓜专利网。

上一篇：非对称多核异构并行处理系统
下一篇：用于执行神经网络计算的指令调度方法及相应计算系统

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top