[发明专利]多参考帧间预测方法、系统、设备及存储介质在审
申请号: | 202111189110.3 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113938687A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 陈志波;冯润森;郭宗昱;张直政 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | H04N19/51 | 分类号: | H04N19/51;H04N19/91;H04N19/124;H04N19/172 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参考 预测 方法 系统 设备 存储 介质 | ||
1.一种用于深度视频编码的多参考帧间预测方法,其特征在于,包括:
将当前视频帧的所有参考帧堆叠为三维张量,并结合当前视频帧通过运动信息编解码器生成包含运动信息的量化隐变量与体素流集合;
利用所述三维张量与体素流集合进行加权插值处理,获得预测帧;
利用所述预测帧与当前视频帧进行残差编码,生成包含残差信息的量化隐变量;
对所述包含运动信息的量化隐变量和包含残差信息的量化隐变量分别做熵编码得到所需传输的码流;
解码过程中,利用所述三维张量以及所述码流中解码出的体素流集合与残差信息,重建当前视频帧。
2.根据权利要求1所述的一种用于深度视频编码的多参考帧间预测方法,其特征在于,所述将当前视频帧的所有参考帧堆叠为三维张量,并通过编解码器生成体素流集合包括:
将当前视频帧参考帧的数目设为n,将n个参考帧堆叠成一个三维张量Xt;
之后,将所述三维张量Xt与当前视频帧xt串联,通过运动信息编码器生成包含运动信息的量化后的隐变量再通过运动信息解码器生成体素流集合gt,每一体素流包含一个三维位置矢量及相应权重。
3.根据权利要求1或2所述的一种用于深度视频编码的多参考帧间预测方法,其特征在于,参考帧在视频序列中的位置位于当前视频帧之前和/或当前视频帧之后。
4.根据权利要求1所述的一种用于深度视频编码的多参考帧间预测方法,其特征在于,所述利用所述三维张量与体素流加权插值处理,获得预测帧表示为:
其中,表示预测帧,Xt表示三维张量,(x,y)表示空域坐标,M表示体素流的数量,表示第i个体素流指向的三维位置,表示第i个体素流的权重。
5.根据权利要求1所述的一种用于深度视频编码的多参考帧间预测方法,其特征在于,所述利用所述三维张量以及所述码流中解码出的体素流集合与残差信息,重建当前视频帧包括:
利用从所述码流中解码出的体素流结合与所述三维张量通过加权插值得到预测帧,再结合残差信息,重建出当前视频帧。
6.一种用于深度视频编码的多参考帧间预测系统,其特征在于,用于实现权利要求1~5任一项所述的方法,该系统包括:
运动信息编解码模块,用于将当前视频帧的所有参考帧堆叠为三维张量,并结合当前视频帧通过运动信息编解码器生成包含运动信息的量化隐变量与体素流集合;
预测模块,用于利用所述三维张量与体素流集合进行加权插值处理,获得预测帧;
残差编码模块,用于利用所述预测帧与当前视频帧进行残差编码,生成包含残差信息的量化隐变量;
码流生成模块,对所述包含运动信息的量化隐变量和包含残差信息的量化隐变量分别做熵编码得到所需传输的码流;
解码模块,用于在解码过程中,利用所述三维张量以及所述码流中解码出的体素流集合与残差信息,重建当前视频帧。
7.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1~5任一项所述的方法。
8.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~5任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111189110.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种刀模快速验收方法
- 下一篇:一种路况信息收集方法、装置、设备及存储介质