[发明专利]神经网络模型处理方法、装置和介质有效
申请号: | 202080033543.7 | 申请日: | 2020-11-19 |
公开(公告)号: | CN113795869B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 王炜;蒋薇;刘杉;崔秉斗;史蒂芬·文格尔 | 申请(专利权)人: | 腾讯美国有限责任公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 焦方佼;王琦 |
地址: | 美国加利福尼亚州*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 处理 方法 装置 介质 | ||
1.一种用于多媒体内容描述和分析的神经网络压缩中的神经网络模型处理方法,其特征在于,包括:
确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;
将所述多维张量中的权重系数限幅在所述饱和最大值的范围内;
基于所述位深度,量化已限幅的权重系数;以及,
向解码器发送包括所述位深度的层报头。
2.根据权利要求1所述的方法,其特征在于,进一步包括:使用可变长度编码或固定长度编码,对所述位深度进行编码,
其中,所述层报头包括已编码的位深度。
3.根据权利要求1所述的方法,其特征在于,所述层报头进一步包括所述饱和最大值。
4.根据权利要求1所述的方法,其特征在于,所述饱和最大值由浮点数表示。
5.根据权利要求4所述的方法,其特征在于,进一步包括:基于以下等式确定表示所述饱和最大值的整数:
int_layer_sat_maxw=int(ceil(layer_sat_maxw*(2**N))),
其中,int_layer_sat_maxw指示所述饱和最大值的整数,ceil()函数返回大于或等于输入数字的最小整数值,N指示N位小数精度,并且layer_sat_maxw指示所述饱和最大值。
6.根据权利要求5所述的方法,其特征在于,进一步包括:使用可变长度编码或固定长度编码,对所述饱和最大值的所述整数进行编码。
7.根据权利要求1所述的方法,其特征在于,所述层报头进一步包括所述量化已限幅的权重系数的步长。
8.根据权利要求1所述的方法,其特征在于,进一步包括:
将已量化的权重系数中的神经网络的四维4D参数张量重塑为所述神经网络的三维3D参数张量,所述3D参数张量包括卷积核大小、输入特征大小和输出特征大小;
将所述3D参数张量沿着平面分区为多个3D编码树单元CTU3D,其中,所述平面由所述输入特征大小和所述输出特征大小形成;以及,
对所述多个CTU3D进行熵编码。
9.根据权利要求8所述的方法,其特征在于,所述CTU3D是不重叠的正方形块。
10.根据权利要求8所述的方法,其特征在于,进一步包括:设置一个标志,以指示每个CTU3D都有一个恒定的大小,
其中,所述对所述3D参数张量进行分区包括:基于设置为指示所述每个CTU3D都有一个恒定大小的所述标志,将所述3D参数张量沿着所述平面划分为具有所述恒定大小的所述多个CTU3D。
11.根据权利要求8所述的方法,其特征在于,进一步包括:设置一个标志,以指示每个CTU3D都有一个基于所述卷积核大小缩放的大小,
其中,所述对所述3D参数张量进行分区包括:基于设置为指示所述每个CTU3D都有一个基于所述卷积核大小缩放的大小,将所述3D参数张量沿着所述平面划分为所述多个CTU3D,其中,所述多个CTU3D中每个CTU3D都有一个基于所述卷积核大小缩放的大小。
12.根据权利要求8所述的方法,其特征在于,所述对所述多个CTU3D进行熵编码包括:在水平方向或垂直方向上,以光栅扫描顺序对所述多个CTU3D进行熵编码。
13.根据权利要求8所述的方法,其特征在于,进一步包括:使用四叉树递归地将所述多个CTU3D中的每一个CTU3D划分为多个3D编码单元CU3D,直到最大深度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080033543.7/1.html,转载请声明来源钻瓜专利网。