[发明专利]一种应用于GPU中的幂指数运算装置和运算方法有效
申请号: | 201210019688.9 | 申请日: | 2012-01-21 |
公开(公告)号: | CN102609236B | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 魏继增;李炳超;常轶松;郭炜;孙济洲 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F7/552 | 分类号: | G06F7/552 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 gpu 中的 指数 运算 装置 方法 | ||
1.一种应用于GPU中的幂指数运算方法,其特征在于,该方法包括以下步骤:
第一步,计算log2 cosθ,数学表达式为:
Ci表示各个分段区间表达式中的常数项;Ci和ai的定点表示值查表获得;e、f表示IEEE754单精度浮点数的指数部分、尾数部分;
第二步,计算x log2 cosθ,x表示高光系数,θ表示反射光线和观察方向之间的夹角,x是一个32位定点数,高8bit表示整数部分,其余位表示小数部分,计算采用CSA乘法器,得到结果mul_result,如果mul_result大于127,则表示结果溢出,最终cosxθ的结果为0;
第三步,计算2mul_result,包括以下步骤:
将mul_result在小数点处拆分成整数部分和小数部分,分别记做int_part和fra_part,如式(1)所示:
2mul_result=2int_part+fra_part=2int_part-121+fra_part (1)
式(1)中,21+fra_part用分段直线去近似,令frac=1+fra_part,则有
将式(2)的计算结果保留小数点后面的23位,记做exp_fra_result;
其中,计算2frac,数学表达式为:
第四步,得到exp_fra_result之后,用IEEE754单精度浮点数表示cosxθ的近似值。
2.一种应用于GPU中的幂指数运算装置,其特征在于,该运算装置包括log2 cosθ运算单元和2frac运算单元,所述log2 cosθ运算单元包括第一、第二多路选择器,二进制23位乘以16位的CSA乘法器和第一、第二加法器;第一多路选择器包括a0~a7共8路输入,s[7:0]为选通信号,且s[7:0]为八位2进制数,第二多路选择器包括c0~c7共8路输入,s[7:0]为选通信号,且s[7:0]为八位2进制数;所述二进制23位乘以16位的CSA乘法器用于实现log2 cosθ运算,数学表达式为:
Ci为各个分段区间表达式中的常数项,Ci和ai的定点表示值查表获得;e、f表示IEEE754单精度浮点数的指数部分、尾数部分;
所述的2frac运算单元包括:第一多路选择器的输入为B0~B7表示反对数表达式中的各个常数项,由frac的高三位直接选通;第二多路选择器的输入为frac>>7、0,选通信号是s1[1:0];第三多路选择器的输入为frac>>5、frac>>4、0,选通信号是s1[3:2];第四多路选择器的输入为frac>>3、frac>>2、0,选通信号是s1[6:4];以及一个22位CSA加法器、一个23位CSA加法器、一个31位CSA加法器和一个31位CPA加法器,所述一个22位CSA加法器、一个23位CSA加法器、一个31位CSA加法器和一个31位CPA加法器实现的运算,其数学表达式为:
其中,0≤frac<1,上述数学式的计算结果是一个不小于1的定点数,只保留小数点后面的23bit。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210019688.9/1.html,转载请声明来源钻瓜专利网。