[实用新型]嵌入式GPU中面积有效、功能复用的裁剪模块有效

专利信息
申请号: 201320452545.7 申请日: 2013-07-25
公开(公告)号: CN203535692U 公开(公告)日: 2014-04-09
发明(设计)人: 魏继增;王航胜;常轶松;孙济洲;郭炜 申请(专利权)人: 天津大学
主分类号: G06T1/20 分类号: G06T1/20;G06T9/00
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 嵌入式 gpu 面积 有效 功能 裁剪 模块
【说明书】:

技术领域

本实用新型涉及计算机图形学和集成电路设计领域,具体讲,涉及嵌入式GPU中面积有效、功能复用的裁剪单元。 

技术背景

目前在图形学中传统的裁剪算法主要有Cohen-Sutherland算法、Liang-Barsky算法、Nicholl-Lee-Nicholl算法、Sutherland-Hodgeman算法。其中前三者是相对于线段而言,最后一个是对于多边形的裁剪。 

在嵌入式GPU领域,目前对于裁剪模块有研究的有韩国科学技术学院(KAIST)的Lee-Sup Kim教授带领的课题组,其成果主要是2005年发表的论文“An11M-triangles/sec3D Graphics Clipping Engine for Triangle Primitives”和2008年发表的论文“Clipping-Ratio-Independent3D Graphics Clipping Engine by Dual-Thread Algorithm”和台湾国立中山大学在2008年发表的论文“Efficient Pre-Clipping and Clipping Algorithms for3D Graphics Geometry Computation”。第一篇论文在预裁剪阶段采用的是编码方法,在裁剪阶段,论文改进了裁剪算法,从而增强了性能,并且提出了相关的硬件架构,给出了最终的时钟频率和所占面积。第二篇论文提出了一种新的硬件架构,该架构同时处理两个三角形的裁剪。第三篇论文提出了一种更加有效的预裁剪算法,提高裁剪率,而在裁剪算法里,改进了Sutherland-Hodgeman算法,用相对应的两个平面来做裁剪,减少了裁剪周期。 

台湾国立中山大学在2008年发表的一篇论文中,在预裁剪阶段增加了斜率判定,提高了剔除率,但是由于该算法只是理论研究,实际在硬件实现上存在两个问题:1:在时间上,计算斜率涉及到除法运算,在硬件上,除法消耗的周期较长。2:在面积上,由于增加了斜率判定,必定会增加许多运算单元,这在嵌入式GPU来说是致命的问题。 

发明内容

为克服现有技术的不足,提高裁剪率,减少裁剪周期,提高嵌入式GPU的整体性能,为此,本实用新型采用的技术方案是,嵌入式GPU中面积有效、功能复用的裁剪模块,包括6个小模块:寄存器组(Register Group)、编码单元(Outcoding Unit)、预裁剪单元(Pre-Clipping Unit)、SH(Sutherland-Hodgeman)裁剪单元(SH Clipping Unit)、共用运算单元(Shared Arithmetic Unit)、以及控制单元(Control Unit);在以上的各个模块中,数据通路如下: 

裁剪模块接收到顶点数据,将数据存放在寄存器组; 

编码单元对顶点数据编码,得到的编码存放回寄存器组,编码完后预裁剪单元判定三角形是否需要裁剪,产生相关信号并将信号传给控制单元; 

控制单元根据预裁剪单元传回的信号,判定是否需要进行SH裁剪,如果根据信号判定三角形和可视窗口相交则需要SH裁剪,将顶点数据传入SH裁剪单元,经过三级裁剪:X和-X,Y和-Y,Z和-Z;产生新的数据并传回顶点寄存器组,最后将新的顶点数据重组若干个 三角形输出,如果信号表明三角形在可视窗口内,则控制单元直接将顶点数据传给下一个模块;如果信号表明三角形在可视窗口外,则控制单元删除顶点数据,并接收下一组顶点数; 

共用运算单元由两个4维向量内积运算单元(Floating-point4D Vector Dot Product,DP4)组成;一共有4对四维向量输入,来自预裁剪单元2对,来自SH裁剪单元2对,并根据控制信号来选择哪2对进行运算,如果控制信号显示目前处于预裁剪阶段,则选择来自预裁剪单元的向量,反之,则选择裁剪单元的向量; 

所述寄存器组:裁剪模块中需要存放三种不同的数据,输入的三角形顶点数据,顶点的编码和新生成的顶点,其中每个顶点所占的位宽为16*4*4=256字节,而每个编码占6位;所述编码单元(Outcoding Unit),由浮点比较器构成,一个顶点需要6个浮点比较器。 

所述预裁剪单元用于:首先从寄存器组中获得顶点的编码并对编码进行与和或运算依次来判定三角形和可视窗口的位置关系,如果编码能判定,则输出相关信号给控制单元,如果不能,则进行斜率判定。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201320452545.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top