[发明专利]内核系数量化在审
申请号: | 202011278819.6 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112800389A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | M·史蒂文斯;A·普尔沃;S·皮珀;E·杜雅尔丁 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F9/30 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内核 系数 量化 | ||
1.一种用于优化矩阵转换的方法,包括:
接收实数矩阵,其中每个实数由尾数和指数表示;
识别要对所述矩阵执行的数学运算;
基于所述矩阵与所述数学运算,确定计算资源需求;
确定所需的计算资源需求超过阈值;
将所述矩阵转换为转换后的矩阵,其中所述转换后的矩阵使所述矩阵之和与所述转换后的矩阵之和之间的误差最小;
基于所述数学运算与所述转换后的矩阵生成结果;以及
提供所述结果。
2.根据权利要求1所述的方法,其中所述矩阵是滤波器内核。
3.根据权利要求1所述的方法,其中所述矩阵具有水平对称性、垂直对称性或对角线对称性中的至少一种,并且其中至少部分地基于所述矩阵的对称性来转换所述矩阵。
4.根据权利要求1所述的方法,其中将所述矩阵转换为转换后的矩阵包括:
裁剪一个或更多个系数以减少所述一个或更多个系数的存储位的数目,并且其中裁剪后的存储位用于确定所述误差。
5.根据权利要求4所述的方法,其中裁剪所述一个或更多个系数包括:减少一个或更多个系数的尾数的存储位的数目。
6.根据权利要求1所述的方法,还包括:
基于所述转换后的矩阵与所述数学运算,确定第二计算资源需求;以及
确定所需的第二计算资源需求未超过所述阈值。
7.根据权利要求1所述的方法,其中所述转换后的矩阵包括被表示为定点数的条目。
8.根据权利要求1所述的方法,其中基于所述矩阵的大小、所述矩阵的最大存储限制以及对所述矩阵执行所述运算的最大计算时间中的至少一个来确定所需的计算资源需求超过阈值。
9.根据权利要求1所述的方法,还包括:
接收第二实数矩阵;
确定要对所述矩阵与所述第二矩阵执行所述数学运算;以及
将所述第二矩阵转换为第二转换后的矩阵,其中所述第二转换后的矩阵使所述第二矩阵之和与所述第二转换后的矩阵之和之间的误差最小;
其中生成所述结果还基于所述第二转换后的矩阵。
10.一种系统,包括:
一个或更多个处理器,所述一个或更多个处理器包括数学处理器;
数学处理存储器,能够操作为执行一个或更多个数学运算;以及
存储器,所述存储器包含指令,所述指令在由所述一个或更多个处理器执行时使得所述系统:
接收实数矩阵,其中每个实数由尾数和指数表示;
识别由所述数学处理器使用所述数学处理存储器对所述矩阵要执行的数学运算;
至少基于所述矩阵与所述数学运算确定计算资源需求;
基于所述数学处理存储器和所述数学处理器中的至少一个,确定所需的计算资源需求超过阈值;
将所述矩阵转换为转换后的矩阵,其中所述转换后的矩阵使所述矩阵之和与所述转换后的矩阵之和之间的误差最小;
将所述转换后的矩阵提供给所述数学处理存储器,以使数学处理器基于所述数学运算与所述转换后的矩阵生成结果;以及
提供所述结果。
11.根据权利要求10所述的系统,其中所述存储器还包括指令以:
基于所述转换后的矩阵与所述数学运算,确定第二计算资源需求;以及
确定所需的第二计算资源需求未超过所述阈值。
12.根据权利要求10所述的系统,其中所述存储器还包括指令以:
裁剪一个或更多个系数以减少所述一个或更多个系数的存储位的数目,并且其中裁剪后的存储位用于确定所述误差。
13.根据权利要求12所述的系统,其中裁剪所述一个或更多个系数包括:减少一个或更多个系数的尾数的存储位的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011278819.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发动机控制系统
- 下一篇:4H-SIC MOSFET器件及其制造方法