[发明专利]一种视频的压缩方法在审
申请号: | 202211201356.2 | 申请日: | 2022-09-29 |
公开(公告)号: | CN115619882A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 温力嘉;段一平 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T3/40 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 100084 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 压缩 方法 | ||
1.一种视频的压缩方法,其特征在于,所述方法包括:
将视频输入视频压缩模型,得到所述视频的每个视频帧的OAR基元;
对所述每个视频帧的OAR基元进行压缩重建,得到压缩后视频;
获取所述视频压缩模型输出的所述压缩后视频。
2.根据权利要求1所述的方法,其特征在于,所述将视频输入视频压缩模型,得到所述视频的每个视频帧的OAR基元,包括:
将所述视频输入所述视频压缩模型,提取所述每个视频帧的目标属性基元、目标关系基元和背景向量;
将所述每个视频帧的目标属性基元、目标关系基元和背景向量进行拼接,得到所述每个视频帧的OAR基元。
3.根据权利要求2所述的方法,其特征在于,所述提取所述视频的每个视频帧的目标属性基元、目标关系基元和背景向量,包括:
对所述每个视频帧进行目标检测,得到目标属性帧、目标关系帧和背景图像帧,所述目标属性帧包括至少一个目标,所述目标关系帧包括至少两个目标,所述背景图像帧不包括目标;
提取所述目标属性帧的目标属性基元,提取所述目标关系帧的目标关系基元,以及提取所述目标属性帧、所述目标关系帧和所述背景图像帧中的背景向量;
将不为所述目标属性帧的视频帧的目标属性基元设置为0,以及将不为所述目标关系帧的视频帧的目标关系基元设置为0;
将所述每个视频帧的目标属性基元、目标关系基元和背景向量进行拼接,得到所述每个视频帧的OAR基元,其中,所述OAR基元中的目标属性基元和/或目标关系基元为0或非0。
4.根据权利要求3所述的方法,其特征在于,所述提取所述目标属性帧的目标属性基元,包括:
将所述目标属性帧输入目标属性基元提取模块,所述目标属性基元提取模块对所述目标属性帧进行压缩解码,得到初步属性特征向量;
对所述初步属性特征向量进行编码,得到所述目标属性帧的均值向量和方差向量;
根据所述目标属性帧的均值向量和方差向量,构建所述目标属性帧的隐向量分布;
对所述目标属性帧的隐向量分布进行解码,得到所述目标属性帧的目标属性基元。
5.根据权利要求3所述的方法,其特征在于,所述提取所述目标关系帧的目标关系基元,包括:
将所述目标关系帧输入目标关系基元提取模块,所述目标关系基元提取模块对所述目标关系帧进行压缩解码,得到初步关系特征向量;
对所述初步关系特征向量进行编码,得到所述目标关系帧的均值向量和方差向量;
根据所所述目标关系帧的均值向量和方差向量,构建所述目标关系帧的隐向量分布;
对所述目标关系帧的隐向量分布进行解码,得到所述目标关系基元。
6.根据权利要求3所述的方法,其特征在于,所述提取所述目标属性帧、所述目标关系帧和所述背景图像帧中的背景向量,包括:
检测所述目标属性帧和所述目标关系帧中的目标所在位置;
基于所述目标所在位置,生成所述目标属性帧和所述目标关系帧各自的目标位置掩膜;
将所述目标属性帧和所述目标属性帧的目标位置掩膜输入背景提取模块,得到所述目标属性帧的背景向量;
将所述目标关系帧和所述目标关系帧的目标位置掩膜输入所述背景提取模块,得到所述目标关系帧的背景向量;
将所述背景图像帧输入所述背景提取模块,得到所述背景图像帧的背景向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211201356.2/1.html,转载请声明来源钻瓜专利网。