[发明专利]对载明并行和依赖运算的指令矩阵进行处理的装置和方法有效
申请号: | 200780017317.4 | 申请日: | 2007-04-12 |
公开(公告)号: | CN101449256A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | M·A·阿卜杜拉 | 申请(专利权)人: | 索夫特机械公司 |
主分类号: | G06F15/00 | 分类号: | G06F15/00 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 钟胜光 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 载明 并行 依赖 运算 指令 矩阵 进行 处理 装置 方法 | ||
1.一种用于对载明并行和依赖运算的指令矩阵进行处理的装置,包括:
存储器,用于存储所述指令矩阵;
流水线,所述流水线包括解码器和执行单元矩阵,所述解码器用于对 所述指令矩阵进行解码,所述执行单元矩阵用于执行所述指令矩阵,所述 指令矩阵包括一组指令行和指令列,跨过所有列的同一行内的每个指令由 所述执行单元矩阵中相应的执行单元子集并行执行,并且依赖于一指令的 源指令的指令在所述指令矩阵的后续指令行中;
与所述指令矩阵的一行对应的第一执行单元子集,用于在单个时钟周 期内并且在没有流水线缓冲的情况下计算第一数据结果和将所述第一数据 结果转发至所述执行单元矩阵的后续行的第二执行单元子集;
所述第二执行单元子集,其从所述指令矩阵分离地接收依赖于所述第 一数据结果的指令;
所述第二执行单元子集在同一单个时钟周期内并且在没有流水线缓冲 的情况下计算第二数据结果和将所述第二数据结果转发至所述执行单元矩 阵的后续行的第三执行单元子集;以及
所述第三执行单元子集,其从所述指令矩阵分离地接收依赖于所述第 二数据结果的指令;
其中,所述指令矩阵是多个指令矩阵中的一个指令矩阵;
其中,所述执行单元矩阵是多个执行单元矩阵中的一个执行单元矩阵; 并且
其中,所述多个执行单元矩阵可替换地用于:
执行组合的指令矩阵,所述组合的指令矩阵形成超级指令矩阵;
独立地以线程模式执行指令矩阵,在所述线程模式中,分离的线程在 执行单元上同时执行;以及
同时执行不同的、非依赖指令矩阵。
2.权利要求1的装置,其中所述执行单元矩阵以不同速率产生数字输 出的切片。
3.权利要求2的装置,其中不同的数字具有不同的位宽。
4.权利要求1的装置,其中所述执行单元矩阵包括经修改的布斯编码。
5.权利要求4的装置,其中所述经修改的布斯编码在数字切片边界插 入零。
6.权利要求1的装置,其中所述执行单元矩阵包括右移移位器,所述 右移移位器使第一组切片数字应用于第一复用器栈,并使第二组切片数字 应用于第二复用器栈,其中所述第一复用器栈大于所述第二复用器栈。
7.权利要求1的装置,其中所述执行单元矩阵包括左移移位器,所述 左移移位器使第一组切片数字应用于第一复用器栈,并使第二组切片数字 应用于第二复用器栈,其中所述第二复用器栈大于所述第一复用器栈。
8.权利要求1的装置,还包括具有延时结构的存储器,以产生第一数 据切片,所述第一数据切片后面跟随有延时的第二数据切片。
9.权利要求1的装置,还包括浮点乘累加单元,所述浮点乘累加单元 实现乘法运算、加法运算、右移运算、左移运算和混合运算。
10.权利要求1的装置,其中,每个指令矩阵具有矩阵数目,以执行 所述多个指令矩阵之间的依赖性保持。
11.权利要求1的装置,其中,所述指令矩阵包括单指令多数据(SIMD) 指令。
12.权利要求1的装置,其中,所述指令矩阵包括多指令多数据(MIMD) 指令。
13.权利要求1的装置,其中,所述指令矩阵包括单指令多数据(SIMD) 指令和多指令多数据(MIMD)指令的组合。
14.权利要求1的装置,其中,所述指令矩阵是通过运行时系统形成 的。
15.权利要求1的装置,其中,所述指令矩阵是通过硬件形成的。
16.权利要求1的装置,其中,所述指令矩阵是通过编译器形成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索夫特机械公司,未经索夫特机械公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780017317.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:安全互联网交易方法和装置
- 下一篇:测距方法和用于确定目标的空间维度的测距仪