[发明专利]一种标量浮点运算加速器有效
申请号: | 201110315230.3 | 申请日: | 2011-10-18 |
公开(公告)号: | CN102693118A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 鞠怡明;葛明艳 | 申请(专利权)人: | 苏州科雷芯电子科技有限公司 |
主分类号: | G06F7/57 | 分类号: | G06F7/57 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 215163 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标量 浮点 运算 加速器 | ||
技术领域
本发明涉及一种运算器,尤其涉及一种使用硬件电路实现标量浮点数运算的运算器。
背景技术
所谓标量浮点数是指一个浮点数,而不是一组浮点数。标量浮点运算一般采用高级语言的函数库做处理,处理起来运算时间长,速度慢,因此,在单片机或嵌入式系统中为加快运算速度往往使用硬件电路完成此类计算。为节省这类运算电路占用更多的系统资源和芯片空间,一般只采用一两种线性函数的运算电路,然而在嵌入式系统中的高端应用领域,像工业控制、POS机、网络设备、图像处理等应用中,要求有较强的数据处理能力,导致较多的硬件运算电路需求,致使处理器芯片面积增加、占用处理器硬件资源增加。
公开日为2011年04月20日、公开号为CN102023839A的专利文献公开了这样的技术方案,一种运算器,包括两个3通道选1通道选择器、一加法器、一减法器、两个乘法器、三个锁存器、一二进制转十进制器、一循环移位器;所述3通道选1通道选择器用于实现并行输入转串行功能;所述加法器、减法器、乘法器用于实现运算功能X=(X1*C+X2*(A-C))/A,所述锁存器用于实现串行转并行输出;所述二进制转十进制器和循环移位器用于实现控制输入和输出,有效地减小了大量芯片面积。该方案不足之处是运算函数单一,对于单变量多次函数及多变量函数计算无法实现。
发明内容
本发明主要是解决现有技术所存在的单片机或嵌入式系统硬件电路实现函数计算时所实现函数单一、过多占用系统资源等技术问题,提供一种标量浮点运算加速器,它采用分段可变参数曲线拟合方式使所有函数运算通过硬件电路实现,在硬件连接上该标量浮点运算加速器被视为一个存储器。
本发明针对现有技术问题主要是通过下述技术方案得以解决的,一种标量浮点运算加速器,包括主控处理器,运算器,还包括接口控制电路,接口寄存器,指令部件,接口控制电路连接接口寄存器,指令部件连接接口寄存器,运算器连接接口寄存器,主控处理器连接接口控制电路,运算器对于单变量函数使用一元二次曲线拟合处理、对于双变量函数采用二元二次曲面拟合处理,拟合处理时对函数进行分段拟合。
其中,接口控制电路处理指令、数据传输的时序控制及状态指示,接口寄存器保存有多个操作数及指令、计算结果和状态寄存器,指令部件根据不同的指令产生相应的控制逻辑,运算器执行函数计算。
该方案为主控处理器配置一个标量浮点运算加速器,以提高科学计算的能力。标量浮点运算加速器将C语言的数学库硬件化,相当于有一个硬件数学库连接在主控处理器上。
主控处理器将标量浮点运算加速器作为一个外部存储器进行连接,在使用标量浮点运算加速器之前先看其忙闲标志是否为空闲,如果为空闲,则可以使用标量浮点运算加速器,否则要等待。
标量浮点运算加速器计算结束后主动向主控处理器发送一个完成中断信号,主控处理器也可以查询标量浮点运算加速器忙闲状态标志,如果处于空闲状态,就说明计算结束。
因为C语言数学库的函数种类很多,而且每种函数的计算都非常复杂。如果针对每种函数设计一套硬件逻辑实现,那硬件设计会非常复杂,甚至到了无法实现的地步。所以本方案采用分段式拟合方式即利用分段曲线、曲面拟合的方法来实现各种函数。对于单变量函数,如求平方根、三角函数等,使用一元二次曲线拟合;对于双变量函数,如除法,采用二元二次曲面拟合。通过分段拟合计算最后得到计算结果。
作为优选,拟合处理单变量函数为一元二次函数:
Y=a0+a1*x+a2*x2=a0+x*(a1+a2*x)
拟合处理双变量函数为二元二次函数:
Yz=a0+a1*x+a2*x2+a3*y+a4*y2+a5*x*y
=a0+x*(a1+a2*x)+a0+y*(a1+a2*y)+a5*x*y
其中a0,a1,a2,a3,a4,a5是参数,不同的分段采用不同的参数,使得函数拟合的精确度提高。
在拟合函数式中有一个通用的计算式,形式是(a1+a2*x),是通用的乘、加模式。
作为优选,拟合函数中的参数由计算机事先计算出,通过加载参数指令从主控处理器传送到参数表中。计算函数时先根据变量值在参数表中查找相应段内的各个参数,然后利用这些参数做拟合函数的计算,最后得到计算结果。
作为优选,接口控制电路与主控处理器之间采用存储器总线连接。采用通用的存储器总线进行指令、数据传输,占用主控处理器资源少、传输速率高、可靠性高、使用方便。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科雷芯电子科技有限公司,未经苏州科雷芯电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110315230.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:变速装置
- 下一篇:微通道内表面上定向生长F掺杂ZnO多孔薄膜的制备