[发明专利]使用压缩感测的视频编解码有效
申请号: | 201610243855.6 | 申请日: | 2011-01-14 |
公开(公告)号: | CN105791830B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | T·多;吕小安;J·索尔 | 申请(专利权)人: | 交互数字麦迪逊专利控股公司 |
主分类号: | H04N19/147 | 分类号: | H04N19/147;H04N19/61;H04N19/103;H04N19/132;H04N19/18;H04N19/19 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 叶齐峰 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 压缩 视频 解码 | ||
本发明提供了用于使用压缩感测的视频编码器和解码器的方法和装置。编码方法通过生成图像块的度量矢量,编码度量矢量,以及通过最小化响应于编码度量矢量的图像块的信号稀疏度重构图像块,来编码画面中的图像块,该度量矢量包括与图像块有关的变换系数(900)。相应解码方法通过接收图像块的度量矢量,解码度量矢量,以及通过最小化响应于解码度量矢量的图像块的信号稀疏度重构图像块,来解码画面的图像块,其中该度量矢量包括与图像块有关的变换系数。
本申请是申请日为2011年1月14日、申请号为201180006149.5、发明名称为“使用压缩感测的视频编解码”的发明专利申请的分案申请。
相关申请的交叉引用
本申请要求于2010年1月15日提交的美国临时申请序列号61/295,258的权益,其通过引用而被整体合并于此。
技术领域
本原理总地涉及视频编码和解码,并且更具体地涉及用于使用压缩感测的视频编码器和解码器的方法和装置。
背景技术
压缩感测(compressive sensing)(也称为压缩采样和压缩传感(compressedsensing))是考虑到信号稀疏或可压缩的现有知识获取和重构信号的一种技术。当使用压缩感测的理论时,可以以比奈奎斯特(Nyquist)采样低得多的速率采样信号。压缩感测用在包括数据压缩、磁共振成像(MRI)等的各种应用中。在文献中,将压缩感测合并到视频压缩框架中来改进残差编解码。由于残差往往并不是非常稀疏的,所以改进是有限的。
假设x是长度为N的信号,如果在如下的某种线性变换Ψ(例如,离散余弦变换(DCT)或离散小波变换(DWT))下可以使用K<<N系数很好地近似x,则认为x是K稀疏的(或可压缩的):
x=Ψα, (1)
其中Ψ是稀疏化变换,α是变换系数矢量,并且在α中只有K系数是非零的。转到图1,用标号100总体指示稀疏信号的表示。表示100涉及长度为N的信号x、稀疏化变换Ψ、和变换系数矢量α。
按照压缩感测理论,这样的信号可以通过如下的不相干线性投影来获取:
y=Φx, (2)
其中y是具有M项的度量矢量,并且Φ代表M×N不相干感测矩阵,其中M<<N。转到图2,用标号200总体指示压缩感测中的度量获取方法。方法200涉及长度为N的信号x、具有M项的度量矢量y、和M×N不相干感测矩阵Φ。
压缩感测框架断言,通过求解如下优化问题,可以只从M≥cK logN(c是小常数)个度量中忠实地恢复x:
α*=arg min|α|1 以便`y=Φx=ΦΨα, (3)
其中输入信号可以用x*=Ψα*近似。在方程(3)中,度量矢量y、感测矩阵Φ、和稀疏化矩阵Ψ是已知的。但是,信号x和它的变换系数矢量α是未知的(要寻找的)。在这样的情况下,α是优化变量。
注意,由于M<<N,所以方程(2)是未定型的,即,存在许多都满足方程(2)的候选信号x。因此,应用最小二乘解的传统途径,即,x′=ΦT(ΦΦT)-1y不能提供x的忠实近似。压缩感测理论提出了通过求解方程(3)识别正确解信号x的替代途径。直观地,方程(3)中的优化问题试图在变换域Ψ中找出具有最少非零项的候选者x。
文献中的最流行不相干感测矩阵Φ之一是随机投影或随机矩阵,其中每项包括独立、相同分布随机变量(例如,每项具有高斯(Gaussian)或贝努利(Bernoulli)分布)。可以示出,这样的随机矩阵最佳地与稀疏化Ψ不相干,因此导致最佳性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交互数字麦迪逊专利控股公司,未经交互数字麦迪逊专利控股公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610243855.6/2.html,转载请声明来源钻瓜专利网。