[发明专利]内核系数量化在审
申请号: | 202011278819.6 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112800389A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | M·史蒂文斯;A·普尔沃;S·皮珀;E·杜雅尔丁 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F9/30 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内核 系数 量化 | ||
本发明公开了内核系数量化,具体公开了在执行矩阵运算时优化存储器使用的装置、系统和技术。在至少一个实施例中,优化矩阵以限制存储器和存储要求,同时最小化矩阵成员之和的精度损失。
技术领域
本申请总地涉及在数据表示方案之间的大数据集的转换中优化处理资源并最小化信息损失。例如,至少一个实施例涉及用于将存储为实数表示的值的矩阵转换为定点表示的处理器或计算机系统,而矩阵内的值之和的损失最小。
背景技术
从实数到定点表示的矩阵转换是在多种领域和应用中发生的常见操作。这些过滤器内核可以具有任意尺寸,并且可以具有或可以不具有对称性。在许多情况下,内核系数之和是特别重要的属性,尤其是在该和为整数的情况下。除了获得所需用法的所需过滤器参数外,这是一个增加的约束。
图1示出了实数矩阵的表示;
图2示出了具有水平和垂直对称性的实数矩阵的表示;
图3示出了具有水平对称性、垂直对称性和对角线对称性的实数矩阵的表示;
图4示出了一个或更多个实施例的流程图。
图5示出了一个或更多个实施例的流程图。
图6示出了根据至少一个实施例的数据中心系统;以及
图7示出了根据至少一个实施例的计算机系统。
具体实施方式
在一组内核系数中,数值可以以多种不同的格式表示,每种格式具有单独的存储约束。例如,对于给定的大数字,对一种存储格式(例如,实数格式)的选择具有可以在存储器中表示该数字的范围。但是,在许多应用程序中,执行其他运算时可能需要特定的数字格式,或者可能导致更有效地使用计算机资源。例如,可以将最初存储为实数的数字转换为定点表示,以便执行矩阵操作所需的计算机资源更少。但是,在数字格式之间进行转换时,精度损失可能会很大。此外,在对转换后的值执行附加运算之后,结果的误差值可能包括不希望的附加误差。例如,将值从浮点转换为定点表示会引入误差。
用于线性子空间之间的转换的一组内核系数通常包括非常大的量。内核系数通常由可以具有任意维度的矩阵表示,具体取决于应用。因为系数是具有高精度的非常大的数,并且矩阵可能具有大维度,所以可能需要大量的存储空间。此外,与以较低的精度存储的相同数字的相同数值操作相比,对系数执行的数学运算通常使用更多的处理资源。存储值以便使用更少的位存储每个系数可以优化资源要求,但会降低精度。
在一些实施例中,接收矩阵。矩阵可以包括多个值,每个值可以由尾数和指数表示,例如浮点值。在一些实施例中,可以接收矩阵,对矩阵执行一个或更多个运算。例如,可以接收具有执行矩阵加法和/或减法的请求的矩阵。由于这些运算可能需要大量资源才能对浮点值执行,因此一个或更多个组件可以基于矩阵的大小和维度确定执行该运算所需的资源超过阈值。可以将矩阵转换为更有利于加法、减法和/或乘法的格式,例如定点表示。转换后,可以再次检查矩阵以确定所需资源是否是可接受的。如果是,则可以执行该运算,并返回结果。因为矩阵值的之和对于某些应用通常是重要的值,所以执行转换以保留该和且误差最小。
本实施例假定将每个都表示为浮点值的值的矩阵转换为定点值。执行转换,以便以最小的误差项保留值之和。对于每个初始值,实数均表示为浮点值,并带有尾数和指数。尾数可以存储为一组位数的带符号2的补码整数。指数值也具有一组位数。所得的定点值均由整数值和分数值表示,每个值均具有固定的位数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011278819.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:发动机控制系统
- 下一篇:4H-SIC MOSFET器件及其制造方法