[发明专利]不会引起密码应用的算术标志的三输入操作数向量ADD指令在审
申请号: | 201180076415.1 | 申请日: | 2011-12-23 |
公开(公告)号: | CN104126173A | 公开(公告)日: | 2014-10-29 |
发明(设计)人: | W·K·费格哈利;V·戈帕尔;J·D·吉尔福德;E·奥兹图科;G·M·沃尔里齐;K·S·雅普;S·M·格尔雷;M·G·迪克森 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/302;G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张东梅 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不会 引起 密码 应用 算术 标志 输入 作数 向量 add 指令 | ||
背景技术
技术领域
本发明一般涉及计算科学,且尤其涉及对于密码应用不会引起算术标志的三输入操作数向量ADD指令。
背景技术
指令执行流水线以及标量对向量处理
图1示出了在半导体芯片上用逻辑电路实现的处理核100的高级图。该处理核包括流水线101。该流水线由各自被设计成在完全执行程序代码指令所需的多步骤过程中执行特定步骤的多个级组成。这些级通常至少包括:1)指令取出和解码;2)数据取出;3)执行;4)写回。执行级对由在先前级(例如在上述步骤1))中所取出和解码的指令所标识并在另一先前级(例如在上述步骤2))中被取出的数据执行由在先前级(例如在上述步骤1))中取出和解码的指令所标识的特定操作。被操作的数据通常是从(通用)寄存器存储空间102中取出的。在该操作完成时所创建的新数据通常也被“写回”寄存器存储空间(例如在上述级4))。
与执行级相关联的逻辑电路通常由多个“执行单元”或“功能单元”103_1至103_N构成,这些单元各自被设计成执行其自身的唯一操作子集(例如,第一功能单元执行整数数学操作,第二功能单元执行浮点指令,第三功能单元执行从高速缓存/存储器的加载操作和/或到高速缓存/存储器的存储操作等等)。由所有这些功能单元执行的所有操作的集合与处理核100所支持的“指令集”相对应。
计算机科学领域中广泛认可两种类型的处理器架构:“标量”和“向量”。标量处理器被设计成执行对单个数据集进行操作的指令,而向量处理器被设计成执行对多个数据集进行操作的指令。图2A和2B呈现了展示标量处理器与向量处理器之间的基本差异的比较示例。
图2A示出标量AND(与)指令的示例,其中单个操作数集A和B一起进行“与”运算以产生奇异(或“标量”)结果C(即,AB=C)。相反,图2B示出向量AND指令的示例,其中两个操作数集A/B和D/E分别并行地一起进行“与”运算以同时产生向量结果C和F(即,A.AND.B=C以及D.AND.E=F)。根据术语学,“向量”是具有多个“元素”的数据元素。例如,向量V=Q,R,S,T,U具有五个不同的元素:Q、R、S、T和U。示例性向量V的“尺寸”是5(因为它具有5个元素)。
图1还示出与通用寄存器空间102不同的向量寄存器空间104的存在。具体而言,通用寄存器空间102标称地用于存储标量值。由此,当各执行单元中的任一个执行标量操作时,它们标称地使用从通用寄存器存储空间102调用的操作数(并且将结果写回通用寄存器存储空间102)。相反,当各执行单元中的任一个执行向量操作时,它们标称地使用从向量寄存器空间104调用的操作数(并将结果写回向量寄存器空间107)。可类似地分配存储器的不同区域以存储标量值和向量值。
算术标志
算术标志用于响应于操作结果重新定向程序流。例如,在条件分支的情况下,可将程序代码写入以:i)如果结果>1则取第一路径;ii)如果结果=1则取第二路径;以及iii)如果结果<1则取第三路径。因此,计算结果的执行单元也被设计成将算术标志设置成指示应用哪个结果。以下的条件分支指令考虑标志设置以决定程序代码选取哪个路径。
算术标志还可用于指示在指令的执行期间已经引起了关注的问题或事件。例如,在“溢出”条件或“进位超出(carry out)”条件的情况下,用于进位和/或保持数学操作(诸如加法)的结果的线的位宽不足够大。例如,ADD操作的正确结果可以是65位宽,然而,可用于传送和/或存储结果的硬连线位宽仅为64位。在这种情况下,引起算术“标志”,该标志促使CPU硬件和/或软件分支到恢复或处理机制,以处理引起标志的问题。
图1示出标志逻辑108的存在。标志逻辑108是被设计成检测并且至少发起算术标志的处理的专用逻辑电路。在问题或差错标志的情况下,诸如溢出或进位超出,对引起该标志的问题的解决本质上对应于在程序执行中的性能冲击(performance hit)或低效。即,通常,需要大量的CPU循环来解决引起标志的状况。在图1中观察到,标志逻辑108耦合到每个执行单元。
密码散列
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180076415.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镀膜玻璃
- 下一篇:基于大型数控框架式液压机的双金属复合导轨板