[发明专利]基于低位移秩的深度神经网络压缩在审
申请号: | 202080021701.7 | 申请日: | 2020-03-13 |
公开(公告)号: | CN113574887A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | F·拉卡佩;S·杰恩;S·哈米迪拉德;D·帕帕季米特里乌 | 申请(专利权)人: | 交互数字VC控股公司 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;G06N3/08 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 美国特*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 位移 深度 神经网络 压缩 | ||
一种用于执行深度神经网络压缩的方法和装置,使用近似训练集以及诸如表示权重、偏差和非线性的矩阵中的信息,来通过网络层权重矩阵的基于低位移秩的近似来迭代地压缩预训练的深度神经网络。所述低位移秩近似允许将预训练的深度神经网络的原始层权重矩阵替换为少量结构化矩阵的总和,从而允许压缩和低推断复杂度。
技术领域
本发明的至少一个实施例一般涉及一种用于视频编码或解码的方法或装置。
背景技术
为了实现高压缩效率,图像和视频译码方案通常采用预测(包括空间和/或运动矢量预测),以及变换以利用视频内容中的空间和时间冗余。通常,帧内或帧间预测用于利用帧内或帧间相关性,然后对原始图像与预测图像之间的差异(通常表示为预测误差或预测残差)进行变换、量化和熵译码。为了重构视频,通过与熵编码、量化、变换和预测相对应的逆处理来对压缩数据进行解码。映射和逆映射过程可用于编码器和解码器中以实现改进的译码性能。实际上,为了更好的译码效率,可以使用信号映射。映射旨在更好地利用视频图片的样本码字值分布。
发明内容
现有技术的缺点和不足可以通过本文描述的一般方面来解决,其涉及编码和解码中的帧内预测模式分割。
根据第一方面,提供了一种方法。所述方法包括以下步骤:获取表示深度神经网络的权重、偏置和非线性的信息以及用于深度神经网络的近似训练集;使用所述信息和所述近似训练集来生成所述深度神经网络的层的信息的输出矩阵;以及,通过迭代地使用深度神经网络的先前层的输出矩阵和所述近似训练集来更新用于附加层的所述输出矩阵,直到已经满足用于该层的最小化准则,并且直到达到最后一层以生成表示所述输出矩阵的系数;以及,对所述系数执行量化和熵译码。
根据第二方面,提供了一种方法。该方法包括以下步骤:对来自比特流的数据执行熵解码;对所述熵解码的数据执行逆量化;以及迭代地获得表示深度神经网络的去量化矩阵并构建权重矩阵,直到达到最后一层。
根据另一方面,提供了一种装置。该装置包括处理器。所述处理器可以被配置为通过执行上述方法中的任何方法来压缩和解压缩深度神经网络。
根据至少一个实施例的另一个一般方面,提供了一种设备,包括根据解码实施例中的任何实施例的装置;以及以下各项中的至少一者:(i)天线,被配置成接收信号,该信号包括视频块,(ii)频带限制器,被配置成将所接收的信号限制到包括视频块的频带,或(iii)显示器,被配置成显示表示视频块的输出。
根据至少一个实施例的另一个一般方面,提供了一种非暂时性计算机可读介质,其包含根据所描述的编码实施例或变型中的任意者生成的数据内容。
根据至少一个实施例的另一个一般方面,提供了一种包括根据所描述的编码实施例或变型中的任意者生成的视频数据的信号。
根据至少一个实施例的另一个一般方面,比特流被格式化为包括根据所描述的编码实施例或变型中的任意者所生成的数据内容。
根据至少一个实施例的另一个一般方面,提供了一种包括指令的计算机程序产品,当所述程序由所述计算机实施时,该指令使所述计算机执行所描述的解码实施例或变型中的任意者。
从以下结合附图阅读的示例性实施例的详细描述中,一般方面的这些和其它方面、特征和优点将变得显而易见。
附图说明
图1示出了在所描述的一般方面下用于基于低位移秩的神经网络压缩的流水线。
图2示出了在所描述的一般方面下的低位移秩近似。
图3示出了在所描述的一般方面下用于确定低位移秩近似层的流程图。
图4示出了在所描述的一般方面下用于低位移秩近似估计的训练/更新循环的流程图的示例。
图5示出了在所描述的一般方面下的解码过程的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交互数字VC控股公司,未经交互数字VC控股公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080021701.7/2.html,转载请声明来源钻瓜专利网。