[发明专利]用于处理非常稀疏和超稀疏矩阵数据的硬件加速器架构在审

申请号：	201711239220.X	申请日：	2017-11-30
公开（公告）号：	CN108268422A	公开（公告）日：	2018-07-10
发明（设计）人：	E.努尔维塔希;D.马尔	申请（专利权）人：	英特尔公司
主分类号：	G06F17/16	分类号：	G06F17/16;G06F9/50
代理公司：	中国专利代理(香港)有限公司 72001	代理人：	郑浩;杨美灵
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：	公开一种用于处理非常稀疏和超稀疏矩阵数据的加速器架构。硬件加速器包括一个或多个片，各包含多个处理元件(PE)和数据管理单元(DMU)。PE要执行涉及由存储器所存储的非常或超稀疏矩阵的矩阵运算。DMU要经由接口(其被优化以提供对存储器的低等待时间、并行随机访问)来提供对存储器的多个PE访问。通过发出对一个或多个矩阵的值的随机访问读请求、发出对用作第二操作数的一个或多个向量的值的随机访问读请求，并且发出对用作结果的一个或多个向量的值的随机访问写请求，PE经由DMU执行矩阵运算。
搜索关键词：	随机访问存储器稀疏矩阵硬件加速器矩阵运算读请求向量稀疏架构矩阵数据管理单元处理元件操作数加速器写请求并行存储优化访问
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于执行关于非常稀疏或超稀疏矩阵的矩阵运算的硬件加速器，包括：一个或多个片，其中每个片包含：多个处理元件(PE)，其用来执行涉及由存储器所存储的、作为第一操作数的一个或多个非常或超稀疏矩阵的矩阵运算；以及数据管理单元(DMU)，其用来提供对所述存储器的所述多个PE访问，所述存储器经由接口用来与所述硬件加速器耦合，所述接口被优化以提供对数据的低等待时间、并行随机访问；其中所述多个PE经由所述DMU通过下列步骤来执行所述矩阵运算：在通过发出对指针值的随机访问读请求来识别所述一个或多个矩阵的值的位置之后发出对所述值的随机访问读请求的第一集合；发出对用作第二操作数的一个或多个向量的第一集合的值的随机访问读请求的第二集合；以及发出对用作结果的一个或多个向量的第二集合的值的随机访问写请求的第三集合。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于英特尔公司，未经英特尔公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711239220.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于处理非常稀疏和超稀疏矩阵数据的硬件加速器架构在审

专利文献下载