[发明专利]对小图元执行着色器占用的方法在审
申请号: | 202110812734.X | 申请日: | 2021-07-19 |
公开(公告)号: | CN114092627A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | K.瓦拉达拉扬;D.C.坦嫰鲍姆;F.古鲁帕德 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06T15/50 | 分类号: | G06T15/50;G06T1/20 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 刘虹 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小图元 执行 着色 占用 方法 | ||
GPU包括着色器核心和着色器线程束打包器单元。着色器线程束打包器单元可以接收与第一部分覆盖的四边形相关联的第一图元以及与第二部分覆盖的四边形相关联的第二图元。着色器线程束打包器单元可以确定第一部分覆盖的四边形和第二部分覆盖的四边形具有不重叠的覆盖。着色器线程束打包器单元可以将第一部分覆盖的四边形和第二部分覆盖的四边形打包到打包的四边形中。着色器线程束打包器单元可以将打包的四边形发送到着色器核心。第一部分覆盖的四边形和第二部分覆盖的四边形可以在空间上彼此分离。着色器核心可以接收和处理打包的四边形,而不丢失与着色器核心单独处理第一部分覆盖的四边形和第二部分覆盖的四边形相关的信息。
相关申请数据
本申请要求2020年8月3日提交的美国临时申请序列号63/060,653的权益,该申请通过引用结合于此。
技术领域
本公开涉及图形处理单元(GPU),并且更具体地,涉及用于对小图元(primitive)执行着色器(shader)占用的方法。
背景技术
现代GPU包括可编程、高度并行的计算引擎的集合和各种固定功能单元的汇集。固定功能单元可以包括纹理地址生成和过滤单元、图元剪切单元、剔除单元、视口变换单元、组合(binning)单元、光栅化设置和光栅化单元、深度比较单元、混合单元和/或其他单元。GPU可用于图形密集型操作和/或计算密集型工作负载。
图形数据可以以流水线方式流经GPU,执行一个或多个应用编程接口(API)(如OpenGL-ES、Vulkan、DirectX等)中概述的步骤。因此,GPU可以符合指定的标准,这些标准可以针对纹理坐标和纹理地址生成。更具体地,在流水线中的像素着色阶段期间,着色器程序可以发出纹理请求并接收过滤后的纹理数据。
在一些模式中,对于每个像素,可以在X和Y维度的每一个中执行方向导数计算,以相对于覆盖的像素(或采样)间隔来确定被访问的纹理的缩小或放大。在本公开的上下文中,术语“采样”和术语“像素”可以互换使用,因为可以理解,在像素级或子像素采样级(sub-pixel sample level)执行相同的操作。通常,这里将参考像素而不是采样。
计算方向导数可以在两个维度的每个维度中使用至少两个数据值。因此,像素着色器可以对2×2四边形(quad)(即四个像素的块)进行操作,作为它们的最小工作量。输入图元可以是三维(3D)图元在二维(2D)图像空间上的投影,并且被光栅化以确定像素覆盖。图元可以是由三个(x,y)坐标对定义的三角形。不管由给定输入图元形成的实际覆盖如何,提供给并行处理器着色器子系统的工作都可以是这些2×2四边形的汇集,如果这些四边形中的许多仅被部分填充(即,部分覆盖),这可能导致很大的低效率。
降低这种低效率的一种方法可以涉及识别部分覆盖的情况,并将覆盖从一个相邻(adjacent)图元转移到另一个图元的四边形。虽然这种方法可以减少发送到着色器的四边形的总数,从而有助于减少总能耗,但这种方法是以损失一些图像质量为代价的。四边形的合并可以使用应用和设置的某些启发式阈值(heuristic threshold)来控制其应用,从而试图避免由于将覆盖从一个图元归于相邻图元而导致的不希望的视觉伪像(artifact),并且作为近似,使用该相邻图元的属性数据。然而,这种四边形合并方法仍然有损耗。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110812734.X/2.html,转载请声明来源钻瓜专利网。