[发明专利]用于执行点积运算的指令和逻辑有效
申请号: | 200710180647.7 | 申请日: | 2007-09-20 |
公开(公告)号: | CN101187861A | 公开(公告)日: | 2008-05-28 |
发明(设计)人: | R·佐哈;M·塞科尼;R·帕塔萨拉蒂;S·钦努帕蒂;M·布克斯顿;C·德西尔瓦 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 曾祥夌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 执行 运算 指令 逻辑 | ||
技术领域
本发明涉及执行数学运算的处理装置及相关软件和软件序列的领域。
背景技术
计算机系统已经越来越深入我们的社会。计算机的处理能力已经提高了各种职业的工人的效率和生产力。由于购买和拥有计算机的费用持续下降,所以越来越多的消费者能够利用更新、更快的机器。此外,许多人由于使用自由而乐于使用笔记本电脑。移动计算机使用户可在离开办公室或旅行时轻松地传输数据以及进行工作。这种情况是营销人员、公司管理人员甚至学生常见的。
随着处理器技术的进步,还产生了更新的软件代码来在具有这些处理器的机器上运行。用户一般预期并要求他们的计算机的更高性能,而不管所使用的软件类型。从处理器内实际执行的指令和操作的种类中可能产生一个这样的问题。根据操作的复杂度和/或所需电路的类型,某些类型的操作需要更多时间来完成。这提供了优化在处理器内部执行某些复杂操作的方式的机会。
十多年来,媒体应用推动了微处理器的发展。实际上,媒体应用推动了近年来的大多数计算升级。这些升级主要在消费者方面发生,但是,对于娱乐增强教育和通信目的,在企业方面也看到显著的进步。然而,还有媒体应用需要更高的计算要求。因此,将来的个人计算体验在视听效果方面更为丰富,并且更容易使用,更重要的是,计算将与通信融合。
因此,图像的显示以及共同称作内容的音频和视频数据的回放已经逐渐成为当前计算装置的流行应用。滤波和卷积操作是对内容数据、如图像音频和视频数据所执行的最常见操作的一部分。这类操作是计算密集的,但是提供可通过采用各种数据存储装置(如单指令多数据(SIMD)寄存器)的有效实现来利用的高级数据并行性。许多当前的体系结构还需要多个操作、指令或子指令(往往称作“微操作”或“μop”)来对多个操作数执行各种数学运算,由此减小吞吐量并增加执行数学运算所需的时钟周期数量。
例如,可能需要由多个指令组成的指令序列来执行产生点积所需的一个或多个运算,包括相加由处理装置、系统或计算机程序中的各种数据类型所表示的两个或两个以上数值之积。但是,这类现有技术可能需要许多处理周期,并且可能使处理器或系统消耗不必要的功率以产生点积。此外,一些现有技术可能在可进行操作的操作数的数据类型方面受到限制。
发明内容
根据本发明的一个方面,提供了一种已在其中存储了指令的机器可读介质,所述指令在由机器执行时,使所述机器执行包括以下步骤的方法:确定各具有第一数据类型的多个打包值的至少两个操作数的点积结果;存储所述点积结果。
根据本发明的另一方面,提供了一种装置,包括:第一逻辑,对第一数据类型的至少两个打包操作数执行单指令多数据点积指令。
根据本发明的又一方面,提供了一种系统,包括:第一存储器,存储单指令多数据点积指令;处理器,连接到所述第一存储器以执行所述单指令多数据点积指令。
根据本发明的再一方面,提供了一种方法,包括:将第一打包操作数的第一数据元素与第二打包操作数的第一数据元素相乘,以产生第一乘积;将所述第一打包操作数的第二数据元素与所述第二打包操作数的第二数据元素相乘,以产生第二乘积;将所述第一乘积与所述第二乘积相加,以产生点积结果。
此外,本发明还提供了一种处理器,包括:源寄存器,存储包括第一数据值和第二数据值的第一打包操作数;目标寄存器,存储包括第三数据值和第四数据值的第二打包操作数;根据所述点积指令所指示的控制值来执行单指令多数据点积指令的逻辑,所述逻辑包括将所述第一数据值和第三数据值相乘以产生第一乘积的第一乘法器、将所述第二数据值和第四数据值相乘以产生第二乘积的第二乘法器,所述逻辑还包括将所述第一乘积和第二乘积相加以产生至少一个和数的至少一个加法器。
附图说明
通过附图、作为实例而非限制地来说明本发明:
图1A是采用处理器组成的计算机系统的框图,包括根据本发明的一个实施例执行点积操作的指令的执行单元;
图1B是根据本发明的一个备选实施例的另一个示范性计算机系统的框图;
图1C是根据本发明的另一个备选实施例的再一个示范性计算机系统的框图;
图2是一个实施例的处理器的微体系结构的框图,包括根据本发明执行点积操作的逻辑电路;
图3A示出根据本发明的一个实施例的多媒体寄存器中的各种打包数据类型表示;
图3B示出根据一个备选实施例的打包数据类型;
图3C示出根据本发明的一个实施例的多媒体寄存器中的各种有符号和无符号打包数据类型表示;
图3D示出一种操作编码(操作码)格式的一个实施例;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710180647.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数控机床中的切屑清扫装置
- 下一篇:一种空中舞台巨型拉线木偶