[发明专利]用于网络规模k均值群集的硬件加速器架构和模板在审
申请号: | 201711282647.8 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108268320A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | D.马尔;G.文卡特什;S.苏巴尚德拉;E.努尔维塔希;S.克里什南 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06K9/62 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张健;郑冀之 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及用于网络规模k均值群集的硬件加速器架构和模板。描述了用于群集的硬件加速器架构。一种硬件加速器包括稀疏瓦片和非常稀疏/超稀疏瓦片。一个或多个稀疏瓦片执行用于涉及矩阵的群集任务的操作。每一个稀疏瓦片包括第一多个处理单元,所述第一多个处理单元对所述矩阵的已被通过高带宽接口从第一存储器单元成流到所述稀疏瓦片的一个或多个随机存取存储器的第一多个块进行操作。所述非常稀疏/超稀疏瓦片中的每一个执行用于涉及所述矩阵的群集任务的操作,所述非常稀疏/超稀疏瓦片中的每一个包括第二多个处理单元,所述第二多个处理单元对所述矩阵的已通过低时延接口从第二存储器单元随机访问的第二多个块进行操作。 | ||
搜索关键词: | 稀疏 瓦片 矩阵 群集 硬件加速器 处理单元 网络规模 架构 随机存取存储器 存储器单元 第二存储器 随机访问 低时延 高带宽 | ||
【主权项】:
1.一种高效地执行网络规模k均值群集的硬件加速器,包括:一个或多个稀疏瓦片,执行用于涉及矩阵的k均值群集任务的第一操作集合,所述稀疏瓦片中的每一个包括第一多个处理单元,所述第一多个处理单元对所述矩阵的已被通过高带宽接口从第一存储器单元成流到所述一个或多个稀疏瓦片的一个或多个随机存取存储器的第一多个块进行操作;以及一个或多个非常稀疏/超稀疏瓦片,执行用于涉及所述矩阵的k均值群集任务的第二操作集合,所述非常稀疏/超稀疏瓦片中的每一个包括第二多个处理单元,所述第二多个处理单元对所述矩阵的已通过低时延接口从第二存储器单元随机访问的第二多个块进行操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711282647.8/,转载请声明来源钻瓜专利网。
- 上一篇:任务调度方法、装置及系统
- 下一篇:用于迁移工作负载的方法和机架系统