[发明专利]使用列折叠和挤压的稀疏矩阵的矩阵乘法加速在审
申请号: | 201910429098.5 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110633793A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | O·阿齐滋;G·布杜赫;T·沃纳;A·杨;M·罗特辛;C·科伦;E·努维塔蒂 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 31100 上海专利商标事务所有限公司 | 代理人: | 何焜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 所公开的实施例涉及使用列折叠和挤压的稀疏矩阵乘法(SMM)加速。在一个示例中,处理器响应于具有用于指定第一矩阵、第二矩阵和输出矩阵的位置的字段的SMM指令而使用执行电路系统通过利用尚待处理的非零元素替换一个或多个零值元素来紧缩所述第二矩阵,所述第二矩阵是稀疏矩阵,被替换的元素中的每个元素进一步包括用于标识其在所述第二矩阵内的逻辑位置的字段,并且所述执行电路系统进一步用于:针对所指定的第一矩阵的行M和列K处的每个非零元素,生成所述元素与所紧缩的第二矩阵的行K列N处的每个相应非零元素的乘积,并且将每个所生成的乘积与所指定输出矩阵的行M和列N处的相应元素的前一值进行累加。 | ||
搜索关键词: | 矩阵 非零元素 电路系统 输出矩阵 稀疏矩阵 字段 替换 紧缩 逻辑位置 乘法 累加 折叠 处理器 挤压 指令 响应 | ||
【主权项】:
1.一种用于执行稀疏矩阵乘法(SMM)指令的处理器,所述处理器包括:/n取出和解码电路系统,用于取出具有用于指定第一矩阵、第二矩阵和输出矩阵的位置的字段的SMM指令并对其进行解码,所述第二矩阵是稀疏矩阵,所述取出电路系统进一步用于将所述第一矩阵的元素和所述第二矩阵的元素从其位置取出并存储到寄存器堆中;以及/n执行电路系统,响应于经解码的SMM指令而通过利用尚待处理的非零元素替换一个或多个零值元素来紧缩存储在所述寄存器堆中的所述第二矩阵,被替换的元素中的每个元素进一步包括用于标识其在所述第二矩阵内的逻辑位置的字段,并且所述执行电路系统进一步用于:针对所述第一矩阵的行M和列K处的每个非零元素,生成所述非零元素与所紧缩的第二矩阵的行K和列N处的每个相应非零元素的乘积,并且将每个所生成的乘积与所述输出矩阵的行M和列N处的相应元素的前一值进行累加。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910429098.5/,转载请声明来源钻瓜专利网。