[发明专利]包含指令调度和取消控制的超级标量微处理器指令流水线无效
申请号: | 94191501.8 | 申请日: | 1994-12-15 |
公开(公告)号: | CN1119473A | 公开(公告)日: | 1996-03-27 |
发明(设计)人: | 约瑟夫P·布拉特;彼得·苏颜特;钱达·S·乔希;莫妮卡R·诺法尔;保罗·罗德曼;约瑟夫T·斯坎伦;唐曼希 | 申请(专利权)人: | 株式会社东芝;硅图像有限公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 酆迅 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包含 指令 调度 取消 控制 超级 标量 微处理器 流水线 | ||
本发明涉及一般流水线化的超级标量微处理器。特别是本发明涉及正常处理中和异常处理后的流水线化超级标量微处理器的指令调度处理。
微处理器具有地址处理、执行和控制动作用的有限个单片供应元。即,在微处理器(在经济性和执行速度两方面)所花费用与供应元数量之间,存在一定的折衷条件。另外,微处理器的设计者在设计特定的供应元组合时,应考虑以最高的效率使用这些供应元,以便发挥最高的性能。
例如,在标量处理器的情况下,作为有意义的供应元的限制例子,可以举出从存储器取出只传送给ALU(运算器)芯片的有效性。该ALU根据数据操作,并供应输出,然后,从存储器传送其他操作数时,则应与执行其他运算对应。
由于ALU是关键部件,所以,可以很容易识别未处于暂停状态。另外,为了提高性能,在ALU之前加了流水线状的结构。即,利用流水线结构可以用尽可能高的速度处理操作数。由于不需要操作数等待,所以,可以提高性能。
但是,在流水线中含有非法数据的状态下,将发生各种问题。这种状态的一个例子是从状态转移产生的。即,流水线可能含有只与转移状态的一个可能性对应的数据,但有时数据是非法的。因此,异常或者陷阱这样的用语就是为了识别由该系统执行的异常处理要求而使用的。
为了处置这种异常情况,开发了各种对策,而新的对策又反复出现新的问题,现在仍继续看。但是,在这种继续进行的新的改良系统的开发中,本来的目的是最大限度地发挥性能。
超级标量微处理器也存在同样的问题,这些问题曾是庞大而复杂的问题。超级标量微处理器具有多功能单元,同一单元不仅执行指令,而且可以作为其他功能单元而执行其他动作。例如,标量处理器具有每一个流水线阶段有1个指令的流水线时,超级标量微处理器就具有每一个阶段可以有多个指令的流水线。
巨型计算机常常采用这种超级标量结构,这时,性能和费用的综合也是重要的问题。同时,由微处理器所具有的供应元发挥最大的计算能力是非常重要的。另外,在发挥最高性能的要点中包括可以迅速处理异常情况的高速而高效率的流水线。这时,用于使功能单元尽可能迅速对应的程序指令需要对处于忙碌状态的供应元进行高速分析。
本发明在具有多种执行能力的超级标量微处理器中提供具有高速且高效率流水线的装置和方法。本发明的流水线,在可利用的供应元流水线内可以迅速地适应于调度的指令。另外,在该流水线中发生的异常情况都可以在同一流水线级中用相同的方法高效率地处理。
按照本发明的一种形式,具有5阶段的超级标量整数流水线,流水线对数据进行取出、译码、地址处理、执行并且写入寄存器文件。这时,预译码器在取出阶段对指令进行预处理,确定供应元的竞争状态,给各指令附加包含特殊分类码的代码,改善指令的调度处理(分配发送处理)。
在译码阶段,按照供应元的记录板和其他供应元的关联状态,将整数指令按程序的顺序传送给功能单元。另外,在地址处理和执行阶段,浮点指令在重新格式化后供给的供应元代码顺序内循环,在4个指令同时写入的阶段,在与浮点单元对应的先进先出(FIFO)队列内循环。
按照本发明的其他形式,在指令执行错误、多种高速缓冲存储器位错误和转移预测错误等情况下的异常处理都在上述执行阶段确定。即,在超级标量流水线中,利用指令优先位,可以可靠地执行具有比异常因素优先性高的指令。另一方面,异常指令和优先性低的指令及其效果被抵消。此外,参照包括附图和权利要求范围在内的本说明书的其余部分,可以理解本发明的其他特征和优点。
图1是具有整数单元12和浮点单元14的超级标量微处理器单元(SMU)10的框图。
图2是表示SMU10的功能指令流程路径(流水线)的一种形式的框图。
图3表示SMU10流水线结构的5阶段整数流水线部分250的同时也是用于说明各阶段执行功能的框图。
图4是表示SMU10流水线结构的浮点流水线300与整数流水线250去耦的框图。
图5是表示包括整数流水线250、外部高速缓存流水线302和浮点流水线300的组合流水线350的框图。
图6是图2所示的调度单元202的详细框图。
图7是表示预译码处理后的重新格式化指令450的模板图。
图8是通过图6所示整数调度单元402的数据通路流程的框图。
图9是用来说明用于设定并确定供应元竞争的寄存器记录板480使用方法的概要图。
图10是基于极佳的实施例的取出和调度系统500的简化框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;硅图像有限公司,未经株式会社东芝;硅图像有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94191501.8/2.html,转载请声明来源钻瓜专利网。