[发明专利]用于具有动态向量长度和码本大小的高吞吐量向量去量化的灵活硬件有效
申请号: | 201880025227.8 | 申请日: | 2018-04-06 |
公开(公告)号: | CN110520870B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | A·A·安巴德卡;A·托米克;C·B·麦克布赖德;G·彼得;K·D·塞多拉;L·M·瓦尔;B·博布罗夫 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06F9/50 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 丁君军 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 神经网络(NN)和/或深度神经网络(DNN)的性能可以由正执行的操作数目以及NN/DNN的存储器数据管理来限制。使用神经元权重值的向量量化,神经元的数据的处理可以优化操作的数目以及存储器利用以便增强NN/DNN的总体性能。操作地,权重值的一个或多个连续段可以被转换为任意长度的一个或多个向量,并且一个或多个向量中的每个向量可以被分配有索引。所生成的索引可以被存储在示例性向量量化查找表中并且在飞行中在运行时由示例性快速权重查找硬件来取回,作为NN的示例性数据处理功能的一部分,作为内联去量化操作的一部分,以获得所需要的一个或多个神经元权重值。 | ||
搜索关键词: | 用于 具有 动态 向量 长度 大小 吞吐量 量化 灵活 硬件 | ||
【主权项】:
1.一种用于神经网络环境中的增强数据处理的系统,所述系统包括:/n至少一个处理器;/n至少一个存储器部件;以及/n至少一个存储器,其与所述至少一个处理器通信,所述至少一个存储器具有存储在其上的计算机可读指令,所述计算机可读指令当由所述至少一个处理器执行时,使得所述至少一个处理器:/n从所述神经网络环境的协作控制器部件接收一个或多个初始化参数,所述初始化参数包括代表待由所述神经网络环境处理的数据的维度的数据以及代表一个或多个向量量化索引值的数据,所述一个或多个索引值代表被存储在所述至少一个存储器部件上的一个或多个向量,所述一个或多个向量包括代表一个或多个神经元权重值的一个或多个连续段的数据;/n利用所述一个或多个向量量化索引值从所述至少一个存储器部件取回代表一个或多个神经元权重值的所述一个或多个向量;/n将所取回的所述一个或多个向量进行去量化以取回底层的一个或多个神经元权重值;以及/n传递所述一个或多个神经元权重值以用于由所述神经网络环境的所述一个或多个处理部件处理。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880025227.8/,转载请声明来源钻瓜专利网。