[发明专利]神经网络模型处理方法、装置和介质有效

专利信息
申请号: 202080033543.7 申请日: 2020-11-19
公开(公告)号: CN113795869B 公开(公告)日: 2023-08-18
发明(设计)人: 王炜;蒋薇;刘杉;崔秉斗;史蒂芬·文格尔 申请(专利权)人: 腾讯美国有限责任公司
主分类号: G06T9/00 分类号: G06T9/00
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 焦方佼;王琦
地址: 美国加利福尼亚州*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 模型 处理 方法 装置 介质
【说明书】:

本公开提供了一种神经网络模型处理方法、装置和介质。所述方法包括:确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;并且,将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。所述方法还包括基于所述位深度,量化已限幅的权重系数;以及,向解码器发送包括所述位深度的层报头。

引用并入

本申请要求于2019年11月22日提交的美国临时专利申请第62/939,057号,2019年11月22日提交的美国临时专利申请第62/939,054号,2019年11月25日提交的美国临时专利申请第62/939,949号,2019年12月12日提交的美国临时专利申请第62/947,236,以及2020年11月16日向美国专利商标局提交的美国专利申请第17/099,202号的优先权。在先申请的全部内容通过引用并入本文。

背景技术

深度神经网络(Deep Neural Networks,DNNs)在语义分类、目标检测/识别、目标跟踪、视频质量增强等大量视频应用中取得成功,因此需要压缩DNN模型。因此,运动图像专家组(Motion Picture Experts Group,MPEG)正在积极致力于神经网络标准(NeuralNetwork standard,NNR)的编码表示,该标准用于对DNN模型进行编码以节省存储和计算。

发明内容

根据实施例,一种用于神经网络模型压缩的量化、自适应块分区和码本编码的方法由至少一个处理器执行,并且包括:确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;并且,将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。所述方法还包括基于所述位深度,量化已限幅的权重系数;以及,向解码器发送包括所述位深度的层报头。

根据实施例,一种用于神经网络模型压缩的量化、自适应块分区和码本编码的装置包括:至少一个存储器,用于存储程序代码;至少一个处理器,用于读取所述程序代码,并按照所述程序代码的指令进行操作。所述程序代码包括:第一确定代码,用于使得所述至少一个处理器确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;以及,限幅代码,用于使得所述至少一个处理器将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。所述程序代码还包括量化代码,用于使得所述至少一个处理器基于所述位深度,量化已限幅的权重系数;以及,发送代码,用于使得所述至少一个处理器向解码器发送包括所述位深度的层报头。

根据实施例,一种非易失性计算机可读介质存储指令,当所述指令由用于神经网络模型压缩的量化、自适应块分区和码本编码的至少一个处理器执行时,使得所述至少一个处理器:确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;以及,将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。当由至少一个处理器执行时,所述指令还使得至少一个处理器基于所述位深度,量化已限幅的权重系数;以及,向解码器发送包括所述位深度的层报头。

附图说明

图1A是将系数裁剪和映射到8位表示的示意图。

图1B是GEPM/GEPP划分方法的示意图。

图2是根据实施例的可以在其中实施本文描述的方法、装置和系统的环境的示意图。

图3是图2中一个或多个设备的示例组件的框图。

图4是根据实施例的用于神经网络模型压缩的系统的功能框图。

图5是根据实施例的用于神经网络模型压缩的量化方法的流程图。

图6是根据实施例的用于神经网络模型压缩的量化装置的框图。

图7是根据实施例的在垂直方向使用光栅扫描的自适应CTU3D/3D编码单元(CU3D)分区的两个示例的图。

图8是根据实施例的用于神经网络模型压缩的自适应块分区方法的流程图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080033543.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top