[发明专利]使用处理器指令的硬件加速矩阵操纵运算在审
申请号: | 202011449371.X | 申请日: | 2020-12-09 |
公开(公告)号: | CN113032009A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 托马斯·马克·乌尔里希;克里希纳库马尔·纳拉亚南·奈尔;郝宇辰 | 申请(专利权)人: | 脸谱公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06N3/063;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李琰;杨明钊 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 处理器 指令 硬件加速 矩阵 操纵 运算 | ||
公开了使用处理器指令的硬件加速矩阵操纵运算。一种处理器系统包括共享存储器和处理元件。处理元件包括矩阵处理器单元,并与共享存储器通信。处理元件被配置成接收指定数据矩阵和矩阵操纵运算的处理器指令。识别基于处理器指令的操纵矩阵。数据矩阵和操纵矩阵被加载到矩阵处理器单元中,并且执行矩阵运算以确定结果矩阵。结果矩阵被输出到目的地位置。
发明背景
使用神经网络可以解决一整类复杂的人工智能问题。神经网络解决方案的实现通常取决于输入源或中间数据如何格式化以及神经网络运算的要求。神经网络运算可能会预期特定的格式的数据。通常将数据从一种矩阵格式转换成另一种矩阵格式,以改善实现神经网络运算的精度和计算成本。传统上,使转换适应硬件解决方案是具有挑战性的,并且转换是在软件中执行的。创建一个既灵活又能显著提高性能和效率的硬件解决方案是一项挑战。因此,需要一种灵活高效的硬件解决方案来执行矩阵操纵(matrix manipulation)运算,矩阵操纵运算包括用于上采样和下采样矩阵的转换运算。
附图简述
在以下详细描述和附图中公开了本发明的各种实施例。
图1是示出用于执行矩阵操纵运算的系统的实施例的框图。
图2是示出用于执行矩阵操纵运算的处理元件的实施例的框图。
图3是示出了使用到具有矩阵处理器单元的处理元件的处理器指令执行矩阵操纵运算的过程的实施例的流程图。
图4是示出使用到具有矩阵处理器单元的处理元件的处理器指令执行矩阵操纵运算的过程的实施例的流程图。
图5是示出使用到具有矩阵处理器单元的处理元件的处理器指令执行矩阵操纵运算的过程的实施例的流程图。
图6是示出使用到具有矩阵处理器单元的处理元件的处理器指令执行矩阵操纵运算的过程的实施例的流程图。
图7是示出用于执行矩阵操纵运算的示例操纵矩阵和对应的向量操作数的图。
图8是示出用于执行矩阵操纵运算的示例输入数据矩阵和对应的矩阵切片(slice)的图。
图9是示出来自执行矩阵操纵运算的示例结果矩阵的图。
图10是示出用于执行矩阵操纵运算的示例操纵矩阵和对应的向量操作数的图。
图11是示出用于执行矩阵操纵运算的示例操纵矩阵和对应的向量操作数的图。
详细描述
本发明可以以多种方式实现,包括作为过程;装置;系统;物质的组成;体现在计算机可读存储介质上的计算机程序产品;和/或处理器,例如被配置为执行存储在耦合到处理器的存储器上和/或由该存储器提供的指令的处理器。在本说明书中,这些实现或者本发明可以采取的任何其他形式可以被称为技术。通常,在本发明的范围内,可以改变所公开的过程的步骤顺序。除非另有说明,否则被描述为被配置为执行任务的诸如处理器或存储器的组件可以被实现为在给定时间被临时配置为执行任务的通用组件或者被制造为执行任务的特定组件。如本文所使用的,术语“处理器”指的是被配置成处理数据(例如计算机程序指令)的一个或更多个设备、电路和/或处理核心。
下面提供了本发明的一个或更多个实施例的详细描述连同说明本发明原理的附图。结合这些实施例描述了本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求限定,并且本发明包括许多替代、修改和等同物。为了提供对本发明的全面理解,在以下描述中阐述了许多具体细节。这些细节是出于示例的目的而提供的,并且本发明可以根据权利要求来被实施,而不需要这些具体细节中的一些或全部。为了清楚起见,没有详细描述与本发明相关的技术领域中已知的技术材料,以便不会不必要地模糊本发明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸谱公司,未经脸谱公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011449371.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于呼吸治疗器具的具有减小的惯性的转动轮
- 下一篇:管道内检测地面标记模块