[发明专利]机器学习稀疏计算机制在审
申请号: | 202010843382.X | 申请日: | 2018-04-09 |
公开(公告)号: | CN112116099A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | B·温布;R·巴里克;N·G·冯博里斯;T-H·林;K·辛哈;E·努尔维塔迪 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/063;G06T1/20 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 丁辰;姜冰 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 稀疏 计算 机制 | ||
1.一种包括指令的非暂态机器可读介质,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行与机器学习框架关联的操作,所述机器学习框架用于促进矩阵乘法,所述操作包括:
将矩阵的元素加载到所述一个或多个处理器的图形处理器的第一存储器中,其中所述第一存储器是所述图形处理器的全局存储器;
将所述矩阵的元素的子集从所述第一存储器转移到所述图形处理器的第二存储器中,所述第二存储器对于所述图形处理器的处理资源的集合是本地的;以及
触发所述图形处理器上的计算内核的执行,其中所述计算内核对所述矩阵的元素的所述子集执行矩阵乘法操作,所述矩阵乘法操作与卷积操作关联,并且所述机器学习框架使得所述计算内核能够指定一个或多个附加逐元素操作以在所述矩阵乘法的输出被转移到所述第一存储器之前对所述输出执行,所述一个或多个附加操作包括将激活函数应用于所述输出。
2.如权利要求1中所述的非暂态机器可读介质,其中在所述矩阵乘法被完成之后并且在所述输出被存储在所述第二存储器中时执行所述一个或多个附加逐元素操作。
3.如权利要求2中所述的非暂态机器可读介质,其中所述激活函数是修正线性单元函数。
4.如权利要求2中所述的非暂态机器可读介质,其中所述一个或多个附加操作另外包括在执行所述激活函数之前执行偏置操作。
5.如权利要求1中所述的非暂态机器可读介质,其中所述计算内核将经由一个或多个图元对所述矩阵的元素的所述子集执行所述矩阵乘法操作,所述一个或多个图元经由所述机器学习框架提供。
6.如权利要求5中所述的非暂态机器可读介质,其中所述机器学习框架将提供图元以使得所述计算内核能够指定要对所述矩阵乘法操作的所述输出执行的一个或多个附加操作。
7.如权利要求5中所述的非暂态机器可读介质,其中所述机器学习框架将提供图元以执行8位整数点积。
8.一种数据处理系统,包括
存储器装置;以及
一个或多个处理器,所述一个或多个处理器配置成执行存储在所述存储器装置中的指令,其中所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行与机器学习框架关联的操作,所述机器学习框架用于促进矩阵乘法,其中所述一个或多个处理器包括图像处理器,并且所述指令使所述一个或多个处理器:
将矩阵的元素加载到所述图形处理器的第一存储器中,其中所述第一存储器是所述图形处理器的全局存储器;
将所述矩阵的元素的子集从所述第一存储器转移到所述图形处理器的第二存储器中,所述第二存储器对于所述图形处理器的处理资源的集合是本地的;以及
触发所述图形处理器上的计算内核的执行,其中所述计算内核将使所述图像处理器对所述矩阵的元素的所述子集执行矩阵乘法操作,所述矩阵乘法操作与卷积操作关联,并且所述机器学习框架使得所述计算内核能够指定一个或多个附加逐元素操作以在所述矩阵乘法的输出被转移到所述第一存储器之前对所述输出执行,所述一个或多个附加操作包括将激活函数应用于所述输出。
9.如权利要求8中所述的数据处理系统,将在所述矩阵乘法被完成之后并且在所述输出被存储在所述第二存储器中时执行所述一个或多个附加逐元素操作。
10.如权利要求9中所述的数据处理系统,其中所述激活函数是修正线性单元函数。
11.如权利要求9中所述的数据处理系统,其中所述一个或多个附加操作另外将在执行所述激活函数之前执行偏置操作。
12.如权利要求8中所述的数据处理系统,其中所述计算内核将经由一个或多个图元对所述矩阵的元素的所述子集执行所述矩阵乘法操作,所述一个或多个图元经由所述机器学习框架提供。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010843382.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:下料自动分拣装置
- 下一篇:基于小样本的疾病亚型预测方法、系统、装置及介质