[发明专利]实现掩蔽向量指令的系统和方法在审
申请号: | 201980075025.9 | 申请日: | 2019-09-18 |
公开(公告)号: | CN113015958A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 玛雅·穆吉尔;M·森蒂尔威兰 | 申请(专利权)人: | 优创半导体科技有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 掩蔽 向量 指令 系统 方法 | ||
一种处理器包括:包括长度寄存器的寄存器文件、包括多个向量寄存器的向量寄存器文件、包括多个掩码寄存器的掩码寄存器文件、以及向量指令执行电路以执行掩蔽向量指令,所述掩蔽向量指令包括表示长度寄存器的第一长度寄存器标识符、表示向量寄存器文件的第一向量寄存器的第一向量寄存器标识符、以及表示掩码寄存器文件的第一掩码寄存器的第一掩码寄存器标识符,其中长度寄存器用于存储表示要应用于在第一向量寄存器中存储的数据元素的操作的数量的长度值,第一掩码寄存器存储多个掩码位,并且多个掩码位中的第一掩码位确定所述操作中相应的第一个是否产生效果。
本申请要求于2018年9月18日提交的美国临时申请62/732,638的优先权,其全部内容通过引用合并于此。
技术领域
本公开涉及到计算机处理器,并且特别地,涉及支持包括掩蔽向量指令的向量指令的处理器。
背景技术
向量处理器(也被称为阵列处理器)是一种硬件处理装置(例如,中央处理单元(CPU)或图形处理单元(GPU)),其实现包含对数据元素的向量进行操作的向量指令的指令集架构(ISA)。向量是包含有序的标量数据元素的单向数组。作为比较,标量指令对单个数据元素进行操作。通过对包含多个数据元素的向量的操作,与支持在单个数据元素上操作的标量指令的标量处理器相比,向量处理器可以实现显著的性能提升。
附图说明
通过以下给出的详细描述和本公开的各个实施例的附图,将更充分地理解本公开。然而,这些附图不应被用于将本公开限制于特定实施例,而仅是为了解释和理解。
图1示出了根据本公开的实施方式的包括掩蔽向量指令的硬件处理器。
图2示出了根据本公开的实施方式的用于管理掩码寄存器的方法的流程图。
具体实施方式
硬件处理器的向量指令是在包含某种数据类型的不只一个元素的向量上执行操作的指令。输入和输出数据可以存储在与处理器相关联的一个或多个向量寄存器中。这些向量寄存器是设计用于保存向量的多个数据元素的存储单元。
示例性向量指令包括x86指令集体系架构(ISA)使用的流式单指令多数据扩展(SSE)指令。ISA的某些实现可以支持可变长度向量指令。可变长度向量指令包括寄存器标识符,其指定存储将要由指令处理的向量的元素数量的寄存器。可变长度向量指令中的寄存器被称为向量长度寄存器。
在某些应用领域(诸如图形着色器)中向量指令可能需要实现用于抑制在向量内的某些位置的元素的影响的机制(称为掩蔽)。掩蔽(masking)的发生可以基于某些条件语句(例如“IF”,“ELSE”和“END-IF”)的结果。在某些情况下,条件可以嵌套。相应地,掩蔽也可以嵌套。
在对图形处理单元(GPU)和通用计算图形处理单元(GPGPU)的编程中,通常要执行的应用代码可以包括由隐式FOR-ALL-ITEMS包围的直线式代码。数据项可以分别为图形模型的顶点、片段或工作项,这取决于应用目的。
应用代码可以容易地转换为向量操作的集合。每个向量操作都对多组输入执行特定的操作。向量操作也称为向量指令。
例如,适用于所有项的一行代码可以是:
FOR-ALL-ITEMS
z=x+y
此代码可以被转换为向量指令:
vadd_w$n,$vz,$vx,$vy
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优创半导体科技有限公司,未经优创半导体科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980075025.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:工件冷压加工成形装置和方法
- 下一篇:ALPHADECK-大面积平板模板系统