[发明专利]执行乘法函数的方法和设备无效
申请号: | 200810109222.1 | 申请日: | 2008-03-28 |
公开(公告)号: | CN101290565A | 公开(公告)日: | 2008-10-22 |
发明(设计)人: | P·T·P·唐;R·D·卡温 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F7/57 | 分类号: | G06F7/57 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 曾祥夌;魏军 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 执行 乘法 函数 方法 设备 | ||
技术领域
本公开一般涉及计算机处理器技术,更具体地但不排他地,涉及 处理器中的算术运算。
背景技术
许多现代计算体系结构提供了硬件倒数指令Y=recip(X)以计算操 作数(例如X)的倒数的近似值。这种倒数指令对于实现浮点除法函数 非常有用。它一般还对于在软件实现许多其它代数函数和超越函数(例 如立方根、正弦、余弦、指数和对数运算)时减少自变量非常有用。例 如,由于浮点除法比加法、减法和乘法更加复杂,因此处理器可首先 使用硬件倒数指令计算recip(B),然后进行A与recip(B)之间的乘法运 算,而不是用硬件实现浮点除法运算A/B。
通常,硬件倒数指令Y=recip(X)具有如下性质:
Y=(1/X)·(1-ε),|ε|≤Δ,(1)
其中Δ是统一阈值。例如,对于IntelItaniumTM处理器Δ约为2-8.8, 以使倒数精确到至少大约8.8有效位。近似的倒数Y然后可被“求精” 到完全精确的倒数,或在求精过程中用于获得完全精确的商,其中X 为分母。在提供了近似倒数的情况下,处理体系结构通常提供额外支 持,使得可以方便地计算上面提到的求精。通用的额外支持是所谓的 积和熔加(fused-multiply-add)指令,其中准确地计算A×B+C的值,之 后再将其舍入到所讨论的浮点格式(与先计算A*B、接着将A×B的结 果舍入、然后再加上C相反)。通过先计算Y=recip(X),然后计算 E=1-Y*X,来实现求精过程。随后是涉及Y和E的适当计算序列。在 许多实际情形下,观察到值E位于关键路径。然而,在许多情况下, 实际上不需要值recip(X)。因此,希望通过在求精过程的关键过程中 去除recip(X)计算来减少求精过程的等待时间。
发明内容
根据本发明的一个方面,提供一种处理器,包括:倒数残差算术 逻辑单元(ALU),用于计算浮点值的倒数残差值。
根据本发明的另一方面,提供一种计算系统,包括:存储器,用 于存储倒数残差指令和浮点值X;以及处理器,耦合到所述存储器, 用于从所述存储器取所述倒数残差指令和X,所述处理器具有倒数残 差算术逻辑单元(ALU)以执行所述倒数残差指令,所述倒数残差指令 计算X的倒数残差值,X的所述倒数残差值是1-X*recip(X),recip(X) 是X的倒数值。
根据本发明的又一方面,提供一种用于计算浮点值(X)的倒数残差 值的设备,包括:乘法器,用于产生X’与X’倒数值的乘积X’*recip(X’), X’是X的标准化值,recip(X’)是X’的倒数值;加法器,用于执行 1-X’*recip(X’),并获得X的所述倒数残差值的中间结果;以及标准化 器/舍入器,用于将所述中间结果标准化,将标准化的中间结果舍入, 并输出X的所述倒数残差值的最终结果。
根据本发明的再一方面,提供一种用于计算浮点值(X)的倒数残差 值的方法,包括:接收浮点值X;将X标准化以获得X的标准化值X’; 以及通过计算1-X’*recip(X’)来计算X的倒数残差值,recip(X’)是X’ 的倒数值。
附图说明
根据以下对所公开主题的详细描述,该主题的特征和优点将变得 更清楚,附图中:
图1示出倒数残差单元可包含在系统的处理器中以计算浮点值的 倒数残差的一个示例计算系统;
图2示出倒数残差单元可包含在系统的处理器中以计算浮点值的 倒数残差的另一个示例计算系统;
图3示出倒数残差单元可包含在系统的处理器中以计算浮点值的 倒数残差的又一个示例计算系统;
图4示出具有用于计算浮点值的倒数残差的倒数残差单元的处理 器的一部分;
图5示出可用于计算浮点值的倒数残差的倒数残差单元的框图; 以及
图6是用于计算浮点值的倒数残差的一个示例过程的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810109222.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有用于切割线的螺旋形引导通道的割草头
- 下一篇:复合式抗疲劳垫及其制作方法