[发明专利]面向神经网络编解码工具的并行推理方法及系统有效
申请号: | 202010100106.4 | 申请日: | 2020-02-18 |
公开(公告)号: | CN111372084B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 马思伟;林凯;贾川民;王苫社;赵政辉 | 申请(专利权)人: | 北京大学 |
主分类号: | H04N19/436 | 分类号: | H04N19/436;H04N19/176;H04N19/147;H04N19/14;H04N19/70;H04N19/82;G06N3/04;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 神经网络 解码 工具 并行 推理 方法 系统 | ||
本发明公开了一种面向神经网络编解码工具的并行推理方法,包括:对待处理的图像进行边界扩充,得到边界完整的图像;根据光栅扫描顺序将所述边界完整的图像划分成大小相同的图像块;将所述大小相同的图像块组织成若干个张量,并将所述若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置所述张量的批尺寸值。通过上述方法,可以有效减少神经网络推理时的显存,降低神经网络视频编码工具的编解码复杂度。
技术领域
本发明涉及数字信号处理技术领域,特别涉及一种面向神经网络编解码工具的并行推理方法及系统。
背景技术
深度学习在传统计算机视觉任务上不断取得突破,环路滤波作为底层的计算机视觉任务,十分适合用深度学习处理,神经网络具有强大的非线性拟合能力,对于视频编码后产生的块效应、振铃效应等有较好的抑制作用。
现有技术中,已有许多针对AVS3,VVC,HEVC等主流视频编码标准的神经网络环路滤波工作。但是一方面神经网络模型计算量通常较大,直接嵌入视频编解码器中导致复杂度成倍增长,另一方面对于大分辨率(4K)的视频序列,由于显存大小的限制,无法整帧进行网络推理。
发明内容
本公开实施例提供了一种面向神经网络编解码工具的并行推理方法及系统。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理方法,包括:
对待处理的图像进行边界扩充,得到边界完整的图像;
根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块;
将大小相同的图像块组织成若干个张量,并将若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置张量的批尺寸值。
进一步地,对待处理的图像进行边界扩充,包括:
使用边界像素对待处理的图像进行镜像扩充;
使用边界像素对待处理的图像进行反射扩充。
进一步地,根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块,包括:
所述图像块的大小可以任意设定;
所述图像块的大小可以与深度学习编码工具中率失真优化决策的块大小一致。
进一步地,将大小相同的图像块组织成若干个张量,包括:
将所述大小相同的图像块放入张量中;
与率失真优化结合,解码端当该图像块的率失真决策结果为真时,将该图像块放入张量中。
进一步地,还包括:
当剩余图像块数量少于设置的张量的批尺寸值时,将剩余图像块组织成一组张量。
进一步地,对待处理的图像进行边界扩充之前,还包括:
获取待处理的图像。
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理装置,包括:
扩充模块,用于对待处理的图像进行边界扩充,得到边界完整的图像;
划分模块,用于根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010100106.4/2.html,转载请声明来源钻瓜专利网。