[发明专利]使用低精度和高精度的混合推理在审
申请号: | 201810367462.5 | 申请日: | 2018-04-23 |
公开(公告)号: | CN108734643A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | E·乌尔德-阿迈德-瓦尔;B·拉克舍玛南;T·史佩斯曼;J·雷;P·T·唐;M·斯特里克兰德;陈晓明;姚安邦;B·J·阿什博;L·L·赫德;马立伟 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06N3/04;G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张欣;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 操作数 解码指令 图形计算单元 指令解码逻辑 计算设备 逻辑单元 指令操作 单个指令 机器学习 解码 通用 推理 | ||
1.一种用于执行机器学习操作的计算设备,所述计算设备包括:
指令解码逻辑,用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及
包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。
2.如权利要求1所述的计算设备,其中,所述通用图形计算单元用于输出所述单个指令的多个结果。
3.如权利要求2所述的计算设备,其中,所述通用图形计算单元用于输出具有不同精度的多个结果。
4.如权利要求3所述的计算设备,其中,所述多个结果包括浮点结果和整数结果。
5.如权利要求4所述的计算设备,其中,所述多个结果包括多个整数结果。
6.如权利要求1至5中任一项所述的计算设备,其中,所述第一逻辑单元是浮点单元,并且所述第一组操作数具有浮点数据类型。
7.如权利要求1至5中任一项所述的计算设备,其中,所述第二逻辑单元被配置成用于执行整数操作,并且所述第二组操作数具有整数数据类型。
8.如权利要求7所述的计算设备,其中,所述第二组操作数包括第一子组操作数和第二子组操作数。
9.如权利要求8所述的计算设备,其中,所述第二逻辑单元用于对所述第一子组操作数和所述第二子组操作数执行相同的操作。
10.如权利要求8所述的计算设备,其中,所述第二逻辑单元用于对所述第一子组操作数执行第一数学运算,并且对所述第二子组操作数执行所述第一数学运算的逆运算。
11.一种执行机器学习操作的方法,所述方法包括:
获取并解码包括多个操作数的单个指令,所述多个操作数引用具有不同精度的多个数据元素;
经由计算单元内的第一逻辑单元对所述多个数据元素中的第一组执行第一指令操作,所述多个数据元素中的所述第一组具有第一精度;
与经由所述第一逻辑单元执行所述第一指令操作并行地、经由所述计算单元内的第二逻辑单元对所述多个数据元素中的第二组执行第二指令操作,所述多个数据元素中的所述第二组具有第二精度;以及
输出所述第一指令操作和所述第二指令操作的结果。
12.如权利要求11所述的方法,其中,所述多个数据元素中的所述第一组具有浮点数据类型。
13.如权利要求11所述的方法,其中,所述多个数据元素中的所述第二组具有整数数据类型。
14.如权利要求11所述的方法,另外包括分派与所述单个指令相关联的多个线程,其中,分派所述多个线程包括将第一线程分派给所述第一逻辑单元并且将第二线程分派给所述第二逻辑单元。
15.一种通用图形处理设备,包括用于执行如权利要求11至14中任一项所述的方法的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810367462.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:对机器学习模型的动态分布训练
- 下一篇:利用时间复用进行的HDR增强