[发明专利]处理器无效
申请号: | 200980108397.3 | 申请日: | 2009-02-11 |
公开(公告)号: | CN101971139A | 公开(公告)日: | 2011-02-09 |
发明(设计)人: | 大卫·马洛尼 | 申请(专利权)人: | 线性代数技术有限公司 |
主分类号: | G06F9/312 | 分类号: | G06F9/312;H03M7/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李春晖;李德山 |
地址: | 爱尔兰*** | 国省代码: | 爱尔兰;IE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理器 | ||
技术领域
本申请涉及的领域是处理器以及在存储器与处理器之间传送数据的方法。更具体地,本申请针对存取存储器中的压缩数据结构内的单个值、或者值的邻近组或非邻近组而无需检索并且解压缩整个压缩结构的方法。
背景技术
在设计计算系统时有个基本问题,就是使存储器存取的时间成本最小化。
这是关于计算机系统设计的根本限制,因为不论使用何种存储器技术支持计算,并且不论使用何种技术将该存储器连接到处理器,都存在关于在给定时间内在处理器与存储器之间可以传送多少信息的最大限制(亦即可用的存储器带宽),可用的存储器带宽对计算机能力的限制常常称为“存储墙(memory-wall)”。
本申请寻求通过用数据压缩来增加有效存储器带宽并且因此使“存储墙”的限制最小化。
已知采用数据压缩来减少“存储墙”效应。然而,编程人员使用压缩存储器子系统的问题在于,数据可以被施予运算之前必须被解压缩,如图1的系统所示。这通常涉及将来自存储器10的一部分的压缩数据读取到处理器16的寄存器文件中,使用从程序存储器18检索到的程序代码对其进行解压缩,并且将解压缩后的数据存储在存储器12的另一未压缩部分中。
然而,这种方案的缺点在于,需要额外的存储器带宽来读取压缩数据,将其存储为未压缩的形式,并且将其读回到处理器以施予运算。还需要额外的存储器容量来保存未压缩的数据,并且解压缩处理将对处理器寄存器文件增加压力。显见,这是一种次优方案,其暗示的内容解释了为何这种压缩存储器子系统依旧是学术探奇而未进入主流微处理器产业。
EP-0240032-A2公开了一种矢量处理器,包括用于存储并且检索矢量数据的存储器。矢量处理器包括:多个矢量寄存器,其中每一个都能够并行读取或者写入多个(m个)矢量元素;至少一个掩码(mask)矢量寄存器,能够并行处理m个掩码比特;传递部分,连接到存储器、多个矢量寄存器和掩码矢量寄存器并且响应于指令用于将来自存储器内规则分开的地址位置的矢量元素传递到与有效掩码比特相对应的所选矢量寄存器的所选存储位置。虽然这种方法有用,但局限在于矢量数据的存储/检索限于整个寄存器。
寄存器模块化是一种用于加速矩阵代数(尤其是有限元)的有用技术,然而,其缺点在于,对于很多矩阵(例如,如搜索引擎诸如GOOGLETM中所使用的)必须添加零填充,减少了有效FLOPS(每秒浮点运算),并且增加了存储器带宽需求,但这二者在现代计算系统中皆为短缺的益处。
实际上,在正分别以每年50%和7%的高度相异的速率增长的处理能力与存储器带宽之间的增长的鸿沟,如上所述,被称为“存储墙”。已有很多人声称“突除”了存储墙,他们通常包括使用缓存来减少必须离开芯片的概率,和/或使用多线程从而可以减小与离开芯片相关联的等待时间和损失。
这些方法只是掩盖了有限外部存储器带宽的问题,但未解决该问题,并且通常依赖于展现出充足的数据位置的数据集、和/或展现出充足的线程级并行性(TLP)的程序,以便根本上有效,并且这可能并非对于所有问题都是正确的,并且当然并非总是事先知道的。实际上,很多更大更被关注的问题既不展现出充足的数据位置也不展现出TLP,整个系统的吞吐量退化到受限于外部存储器带宽的地步,并且已经在芯片上添加的额外硬件是无用的。为此,大型工程应用将处理器性能拉低到制造商所号称的峰值性能规格的1%或更低并不罕见。
发明内容
本申请寻求增加有效的存储器带宽,并且通过以压缩格式存储数据来使“存储墙”对计算的局限最小化。这是通过提供压缩和解压缩装置来实现的,该压缩和解压缩装置适合于在对必须存储在存储器中的庞大数据集进行运算的很多应用(包括例如计算机图形、刚体动力学、有限元分析和其它科学工程应用)中使用的块结构数据。为了进一步减少“存储墙”效应,处理器流水线也被修改为利用压缩,将处理速率提高超过仅通过对压缩数据进行运算可以实现的速率。
更特别地,本申请允许通过使用值映射以及被指定为指令的一部分的相关联字段比特来随机存取存储器中存储的压缩结构中的各个值。
因此,本申请的第一实施例提供一种如权利要求1和38中详述的处理器。本申请还提供一种如权利要求21和56中详述的方法。本申请进一步提供一种如权利要求35和69中详述的数据处理机。在从属权利要求中提供了有利的实施例。
附图说明
现在参照附图描述本申请,其中:
图1是现有技术中已知的处理器布置,
图2是本申请的处理器适用于处理的一系列变换,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于线性代数技术有限公司,未经线性代数技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980108397.3/2.html,转载请声明来源钻瓜专利网。