[发明专利]用于稀疏-密集矩阵乘法的加速器在审
申请号: | 201910227563.7 | 申请日: | 2019-03-25 |
公开(公告)号: | CN110321525A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | S·纳拉亚纳穆尔蒂;N·R·萨蒂什;A·苏普鲁恩;K·J·珍妮克 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 所公开的实施例涉及用于稀疏‑密集矩阵指令的加速器。在一个示例中,一种用于执行稀疏‑密集矩阵乘法指令的处理器,包括:取出电路,用于取出稀疏‑密集矩阵乘法指令,稀疏‑密集矩阵乘法指令具有用于指定操作码、密集输出矩阵、密集源矩阵、和具有非零元素的稀疏度的稀疏源矩阵的字段,稀疏度小于一;解码电路,用于对所取出的稀疏‑密集矩阵乘法指令解码;执行电路,用于执行经解码的稀疏‑密集矩阵乘法指令以对于所指定的稀疏源矩阵的行M和列K处的每个非零元素进行以下操作:生成该非零元素与所指定的密集源矩阵的行K和列N处的每个对应密集元素的乘积;以及生成每个所生成的乘积与所指定的密集输出矩阵的行M和列N处的对应输出元素的先前值的累加和。 | ||
搜索关键词: | 稀疏 矩阵乘法 指令 矩阵 非零元素 取出 输出矩阵 加速器 稀疏度 稀疏源 源矩阵 电路 解码 解码电路 输出元素 指令解码 操作码 累加和 处理器 字段 | ||
【主权项】:
1.一种用于执行稀疏‑密集矩阵乘法(SDMM)指令的处理器,包括:取出电路,用于从代码存储取出所述SDMM指令,所述SDMM指令具有用于指定操作码、密集输出矩阵、密集源矩阵和稀疏源矩阵的字段,所述稀疏源矩阵具有非零元素的稀疏度,所述稀疏度小于一;解码电路,用于对所取出的SDMM指令解码;以及执行电路,用于响应于经解码的SDMM指令而对于所指定的稀疏源矩阵的行M和列K处的每个非零元素进行以下操作:生成所述非零元素与所指定的密集源矩阵的行K和列N处的每个对应密集元素的乘积;以及生成每个所生成的乘积与所指定的密集输出矩阵的行M和列N处的对应输出元素的先前值的累加和。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910227563.7/,转载请声明来源钻瓜专利网。