[发明专利]一种压缩编码、解压缩方法以及装置有效
申请号: | 202011271217.8 | 申请日: | 2020-11-13 |
公开(公告)号: | CN114501031B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 师一博;王晶;白博 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N19/61 | 分类号: | H04N19/61;H04N19/91;H04N19/124 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 陈松浩 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 压缩 编码 解压缩 方法 以及 装置 | ||
本申请涉及人工智能领域中的视频帧编解码技术,公开了一种压缩编码、解压缩方法以及装置。方法应用于编码端,包括:通过第一编码网络,对第一视频帧进行变换编码,以生成第一视频帧的第一特征;根据第二视频帧,通过神经网络生成第一视频帧的第一预测特征,第二视频帧为第一视频帧的参考帧;根据第一预测特征,生成第一特征的概率分布;根据第一特征的概率分布,通过熵编码的方式,对第一特征进行压缩编码,得到与第一视频帧对应的第一压缩信息,发送第一压缩信息。由于解码端是直接利用当前视频帧的压缩信息来得到的当前视频帧,则得到的当前视频帧的质量不会依赖于首帧,也不会让误差在逐帧之间累积。
技术领域
本申请涉及人工智能领域,尤其涉及一种压缩编码、解压缩方法以及装置。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
目前,基于深度学习(deep learning)的神经网络对视频帧进行压缩是人工智能常见的一个应用方式。具体的,将视频划分为多组视频帧(group of pictures,GOP),针对一组视频帧中非首帧,计算当前帧相对于前一帧的光流,生成原始的当前视频帧相对于前一视频帧的光流,将光流进行压缩编码,得到压缩后的光流。对该压缩后的光流进行解压缩得到解压缩后的光流,根据解压缩后的光流和前一帧的解码视频帧,生成预测的当前视频帧,计算原始的当前视频帧与预测的当前视频帧之间的残差,对该残差进行压缩编码。将压缩后的光流和压缩后的残差发送给解码端,从而解码端可以利用解码出来的上一视频帧、解压缩后的光流以及解压缩后的残差,以解码出当前视频帧。
但是,由于上述对视频帧的压缩方法,过于依赖一组视频帧中首帧(也可以称为参考帧)的压缩质量,且误差会在逐帧累积。
发明内容
本申请提供了一种压缩编码、解压缩方法以及装置,由于解码端是直接利用当前视频帧的压缩信息来得到的当前视频帧,所以解码端得到的当前视频帧的质量不会依赖于一组视频帧中的首帧,也不会让误差在逐帧之间累积。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种压缩编码方法,可用于人工智能领域的视频帧编解码领域中,方法应用于编码端,包括:通过第一编码网络,对第一视频帧进行变换编码,在进行变换编码之后会再进行量化,从而可以得到第一视频帧的第一特征。根据N个第二视频帧,通过神经网络对第一视频帧的特征进行预测,以生成第一视频帧的第一预测特征;其中,第二视频帧为第一视频帧的参考帧,与第二视频帧对应的原始视频帧在视频中的排序位置与第一视频帧相邻,可以位于第一视频帧之前,也可以位于第一视频帧之后,N为大于或等于1的整数。根据第一预测特征,生成第一特征的概率分布,第一特征的概率分布包括第一特征的均值和第一特征的方差;根据第一特征的概率分布,利用神经网络,通过熵编码的方式,对第一特征进行压缩编码,得到与第一视频帧对应的第一压缩信息,并发送第一压缩信息,第一压缩信息用于供解码端得到第一视频帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011271217.8/2.html,转载请声明来源钻瓜专利网。