[发明专利]神经网络模型压缩在审
申请号: | 202180005390.X | 申请日: | 2021-04-13 |
公开(公告)号: | CN114402596A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 王炜;蒋薇;刘杉 | 申请(专利权)人: | 腾讯美国有限责任公司 |
主分类号: | H04N19/117 | 分类号: | H04N19/117 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王曙聘 |
地址: | 美国加利福尼亚州*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 压缩 | ||
1.一种在解码器处进行神经网络解码的方法,包括:
从神经网络的压缩表示的比特流接收依赖性量化启用标志,所述依赖性量化启用标志指示是否将依赖性量化方法应用于所述神经网络的模型参数;以及
响应于所述依赖性量化启用标志指示使用所述依赖性量化方法对所述神经网络的模型参数进行编码,基于所述依赖性量化方法来重构所述神经网络的模型参数。
2.根据权利要求1所述的方法,其中,在模型水平、层水平、子层水平、3维编码单元(CU3D)水平或3维编码树单元(CTU3D)水平用信号传输所述依赖性量化启用标志。
3.根据权利要求1所述的方法,还包括:
响应于所述依赖性量化启用标志指示使用均匀量化方法对所述神经网络的模型参数进行编码,基于所述均匀量化方法来重构所述神经网络的模型参数。
4.一种在解码器处进行神经网络解码的方法,包括:
在接收神经网络的压缩表示的比特流中的权重系数的第二子层之前,接收所述比特流中的系数的一个或更多个第一子层,所述第一子层和所述第二子层属于所述神经网络的层。
5.根据权利要求4所述的方法,还包括:
在重构所述权重系数的第二子层之前重构所述系数的一个或更多个第一子层。
6.根据权利要求4所述的方法,其中,所述系数的一个或更多个第一子层包括缩放因子系数子层、偏差系数子层或者一个或更多个批归一化系数子层。
7.根据权利要求4所述的方法,其中,所述神经网络的层为卷积层或全连接层。
8.根据权利要求4所述的方法,其中,使用量化或未量化的值来表示所述一个或更多个第一子层的系数。
9.根据权利要求4所述的方法,还包括:
基于与所述神经网络的压缩表示的比特流分开传输的所述神经网络的结构信息来确定所述第一子层和所述第二子层的解码序列。
10.根据权利要求4所述的方法,还包括:
接收指示所述一个或更多个第一子层在所述神经网络的层中是否可用的一个或更多个标志。
11.根据权利要求4所述的方法,还包括:
基于所述神经网络的结构信息,将1维张量推断为与所述系数的第一子层中之一对应的偏差或局部缩放张量。
12.根据权利要求4所述的方法,还包括:
在推断过程期间合并已经被重构的所述系数的第一子层以生成系数的组合张量;
接收属于所述权重系数的第二子层的一部分的重构的权重系数作为所述推断过程的输入,而所述权重系数的第二子层的其余部分仍在被重构;以及
在所述推断过程期间执行对所述系数的组合张量和所接收的重构的权重系数的矩阵乘法。
13.一种在解码器处进行神经网络解码的方法,包括:
接收神经网络的压缩表示的比特流中的第一统一启用标志,所述第一统一启用标志指示是否将统一参数约简方法应用于所述神经网络的模型参数;以及
基于所述第一统一启用标志来重构所述神经网络的模型参数。
14.根据权利要求13所述的方法,其中,所述第一统一启用标志包括在模型参数集或层参数集内。
15.根据权利要求13所述的方法,还包括:
响应于确定将所述统一方法应用于所述神经网络的模型参数来接收统一性能映射,所述统一性能映射指示一个或更多个统一阈值与使用相应的统一阈值压缩的神经网络的相应的一组或更多组推断准确度之间的映射。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180005390.X/1.html,转载请声明来源钻瓜专利网。