[发明专利]一种视频的压缩方法在审
申请号: | 202211201356.2 | 申请日: | 2022-09-29 |
公开(公告)号: | CN115619882A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 温力嘉;段一平 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T3/40 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 100084 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 压缩 方法 | ||
本申请提供了一种视频的压缩方法,涉及视频处理技术领域。所述方法包括:将视频输入视频压缩模型,得到所述视频的每个视频帧的OAR基元;对所述每个视频帧的OAR基元进行压缩重建,得到压缩后视频;获取所述视频压缩模型输出的所述压缩后视频。
技术领域
本申请涉及视频处理技术领域,特别是涉及一种视频的压缩方法。
背景技术
和深度学习融合的生成式重建对于视频的压缩具有重要意义,主要因为:一方面,随着视频媒体网络业务量剧增,出现了许多不同以往的应用场景,例如从标清到高清再到4k和8k,对视频压缩编解码传输能力提出了新的挑战;另一方面,虚拟现实(VR)、增强现实(AR)等新兴多媒体技术的应用,也吸引研究者发展新兴视频编解码方法。生成式重建的编解码码率远小于传统的压缩编解码码率,在视频压缩比上具有较大优势。同时,深度学习在图像处理领域发展迅速,特别在图像检测、分类、表征、生成等方面获得不错成果,为视频的生成式压缩重建提供了技术支持。
相关技术中,直接对视频的每一视频帧进行生成式压缩重建,然后将每一视频帧按照顺序进行拼接得到进行了压缩的视频。然而,这种方法得到的视频质量较低。
发明内容
鉴于上述问题,本申请实施例提供了一种视频的压缩方法,以便克服上述问题或者至少部分地解决上述问题。
本申请实施例的第一方面,提供了一种视频的压缩方法,所述方法包括:
将视频输入视频压缩模型,得到所述视频的每个视频帧的OAR基元;
对所述每个视频帧的OAR基元进行压缩重建,得到压缩后视频;
获取所述视频压缩模型输出的所述压缩后视频。
可选地,所述将视频输入视频压缩模型,得到所述视频的每个视频帧的OAR基元,包括:
将所述视频输入所述视频压缩模型,提取所述每个视频帧的目标属性基元、目标关系基元和背景向量;
将所述每个视频帧的目标属性基元、目标关系基元和背景向量进行拼接,得到所述每个视频帧的OAR基元。
可选地,所述提取所述视频的每个视频帧的目标属性基元、目标关系基元和背景向量,包括:
对所述每个视频帧进行目标检测,得到目标属性帧、目标关系帧和背景图像帧,所述目标属性帧包括至少一个目标,所述目标关系帧包括至少两个目标,所述背景图像帧不包括目标;
提取所述目标属性帧的目标属性基元,提取所述目标关系帧的目标关系基元,以及提取所述目标属性帧、所述目标关系帧和所述背景图像帧中的背景向量;
将不为所述目标属性帧的视频帧的目标属性基元设置为0,以及将不为所述目标关系帧的视频帧的目标关系基元设置为0;
将所述每个视频帧的目标属性基元、目标关系基元和背景向量进行拼接,得到所述每个视频帧的OAR基元,其中,所述OAR基元中的目标属性基元和/或目标关系基元为0或非0。
可选地,所述提取所述目标属性帧的目标属性基元,包括:
将所述目标属性帧输入目标属性基元提取模块,所述目标属性基元提取模块对所述目标属性帧进行压缩解码,得到初步属性特征向量;
对所述初步属性特征向量进行编码,得到所述目标属性帧的均值向量和方差向量;
根据所述目标属性帧的均值向量和方差向量,构建所述目标属性帧的隐向量分布;
对所述目标属性帧的隐向量分布进行解码,得到所述目标属性帧的目标属性基元。
可选地,所述提取所述目标关系帧的目标关系基元,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211201356.2/2.html,转载请声明来源钻瓜专利网。