[发明专利]基于高维离散余弦变换的无参考光场图像质量评价方法有效
申请号: | 202110244734.4 | 申请日: | 2021-03-05 |
公开(公告)号: | CN112950592B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 郁梅;项建军;蒋志迪;蒋刚毅 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06F16/245 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 离散 余弦 变换 参考 图像 质量 评价 方法 | ||
1.一种基于高维离散余弦变换的无参考光场图像质量评价方法,其特征在于包括以下步骤:
步骤1:将待评价的4维的光场图像记为L,L的角度分辨率为U×V,L的空间分辨率为X×Y;然后将L视作为2维的子孔径图像阵列,子孔径图像阵列由U×V幅子孔径图像构成,每幅子孔径图像的分辨率为X×Y,将子孔径图像阵列中视点坐标位置为(u,v)的子孔径图像记为Iu,v;其中,1≤u≤U,1≤v≤V;
步骤2:将子孔径图像阵列中除最后一行和最后一列外的每幅子孔径图像作为待处理子孔径图像,将子孔径图像阵列中视点坐标位置为(u',v')的待处理子孔径图像记为Iu',v';然后计算子孔径图像阵列中的每幅待处理子孔径图像与其水平相邻的子孔径图像之间的水平差分图像,将Iu',v'与其水平相邻的子孔径图像即子孔径图像阵列中视点坐标位置为(u'+1,v')的待处理子孔径图像Iu'+1,v'之间的水平差分图像记为将中坐标位置为(x,y)的像素点的像素值记为并计算子孔径图像阵列中的每幅待处理子孔径图像与其垂直相邻的子孔径图像之间的垂直差分图像,将Iu',v'与其垂直相邻的子孔径图像即子孔径图像阵列中视点坐标位置为(u',v'+1)的待处理子孔径图像Iu',v'+1之间的垂直差分图像记为将中坐标位置为(x,y)的像素点的像素值记为接着计算子孔径图像阵列中的每幅待处理子孔径图像的子孔径梯度图像,将Iu',v'的子孔径梯度图像记为Gu',v',将Gu',v'中坐标位置为(x,y)的像素点的像素值记为Gu',v'(x,y),在得到子孔径图像阵列中的所有待处理子孔径图像的子孔径梯度图像后,将子孔径图像阵列转换成子孔径梯度图像阵列,记为G,G的角度分辨率为(U-1)×(V-1),即由(U-1)×(V-1)幅子孔径梯度图像构成,G的空间分辨率为X×Y,即每幅子孔径梯度图像的分辨率为X×Y;其中,1≤u'≤U-1,1≤v'≤V-1,1≤x≤X,1≤y≤Y,符号“| |”为取绝对值符号,Iu',v'(x,y)表示Iu',v'中坐标位置为(x,y)的像素点的像素值,Iu'+1,v'(x,y)表示Iu'+1,v'中坐标位置为(x,y)的像素点的像素值,Iu',v'+1(x,y)表示Iu',v'+1中坐标位置为(x,y)的像素点的像素值;
步骤3:将G划分为个互不重叠的尺寸为4×4×4×4的4D块,将G中的第s个4D块记为GBs,将GBs中坐标位置为(u1,v1,x1,y1)的像素点的像素值记为GBs(u1,v1,x1,y1);然后采用四维离散余弦变换技术将G中的每个4D块转换到4D-DCT域中,得到G中的每个4D块对应的频域块,将GBs对应的频域块记为FBs,将FBs中频域坐标位置为上的值记为即为GBs在4D-DCT域中在频域坐标位置上的4D-DCT系数,GBs在4D-DCT域中共包含有256个4D-DCT系数,包括1个直流系数和255个交流系数,当时GBs在4D-DCT域中在频域坐标位置(1,1,1,1)上的4D-DCT系数为直流系数;其中,符号为向下取整符号,1≤u1≤4,1≤v1≤4,1≤x1≤4,1≤y1≤4,函数g()的功能定义为a1,a2为两个参数;
步骤4:计算G中的所有4D块在4D-DCT域中在相同频域坐标位置上的交流系数所对应的能量值,在不为(1,1,1,1)的情况下将G中的所有4D块在4D-DCT域中在频域坐标位置上的交流系数所对应的能量值记为然后将得到的255个能量值按顺序排列构成维数为255×1的能量向量,作为L对应的能量向量,并记为E,E=[E1,E2,…,Ek,…,E255]T;其中,1≤k≤255,符号“[]”为向量或矩阵表示符号,E1表示E中的第1个元素,E2表示E中的第2个元素,Ek表示E中的第k个元素,E255表示E中的第255个元素,k与的关系为:E1=e(1,1,1,2),E2=e(1,1,1,3),E255=e(4,4,4,4),上标“T”表示向量或矩阵的转置;
步骤5:提取出G中的所有4D块在4D-DCT域中在相同频域坐标位置上的交流系数的振幅并构成维数为1×SZ的振幅向量,在不为(1,1,1,1)的情况下将G中的所有4D块在4D-DCT域中在频域坐标位置上的交流系数的振幅构成的振幅向量记为然后对得到的每个振幅向量用韦伯概率分布进行拟合,拟合后得到对应的尺度参数,将对用韦伯概率分布进行拟合后得到的对应的尺度参数记为再将得到的255个尺度参数按顺序排列构成维数为255×1的无符号系数分布特征向量,作为L对应的无符号系数分布特征向量,并记为λ,λ=[λ1,λ2,…,λk,…,λ255]T;其中,符号“||”为取绝对值符号,表示G中的第1个4D块记为GB1对应的频域块FB1中频域坐标位置为上的值,表示G中的第SZ个4D块记为GBSZ对应的频域块FBSZ中频域坐标位置为上的值,为的振幅,为的振幅,为的振幅,λ1表示λ的第1个元素,λ2表示λ的第2个元素,λk表示λ的第k个元素,λ255表示λ的第255个元素,k与的关系为:λ1=w(1,1,1,2),λ2=w(1,1,1,3),λ255=w(4,4,4,4);
步骤6:选取N幅用于训练的4维的无失真光场图像,按照步骤1至步骤5的过程,以相同的方式获取每幅无失真光场图像对应的能量向量和无符号系数分布特征向量;然后将N幅无失真光场图像对应的能量向量构成训练的能量矩阵,记为ZE,ZE=[TE1,TE2,…,TEn,…,TEN],将N幅无失真光场图像对应的无符号系数分布特征向量构成训练的无符号系数分布特征矩阵,记为ZW,ZW=[TW1,TW2,…,TWn,…,TWN];然后对ZE进行主成分分析,获得维数为255×m1的能量投影矩阵,记为同样,对ZW进行主成分分析,获得维数为255×m2的无符号系数分布特征投影矩阵,记为其中,N≥100,无失真光场图像的角度分辨率为U×V,无失真光场图像的空间分辨率为X×Y,ZE和ZW的维数均为255×N,TE1表示第1幅无失真光场图像对应的能量向量,TE2表示第2幅无失真光场图像对应的能量向量,TEn表示第n幅无失真光场图像对应的能量向量,TEN表示第N幅无失真光场图像对应的能量向量,TW1表示第1幅无失真光场图像对应的无符号系数分布特征向量,TW2表示第2幅无失真光场图像对应的无符号系数分布特征向量,TWn表示第n幅无失真光场图像对应的无符号系数分布特征向量,TWN表示第N幅无失真光场图像对应的无符号系数分布特征向量,1≤n≤N,m1和m2均为正整数,1≤m1+m2<N;
步骤7:对E进行去中心化处理,得到去中心化处理后的能量向量,记为同样,对λ进行去中心化处理,得到去中心化处理后的无符号系数分布特征向量,记为然后用对进行降维,得到L对应的裁剪的能量向量,记为FE,同样,用对进行降维,得到L对应的裁剪的无符号系数分布特征向量,记为FW,其中,和的维数为255×1,μZE为通过对ZE中的每行逐行求平均得到,即μZE中的第k个元素为ZE中的第k行的所有元素的平均值,μZW为通过对ZW中的每行逐行求平均得到,即μZW中的第k个元素为ZW中的第k行的所有元素的平均值,FE的维数为m1×1,FW的维数为m2×1;
步骤8:将FE和FW连接起来构成的向量作为L的感知特征向量,记为F,F=[(FE)T,(FW)T];其中,F的维数为1×(m1+m2);
步骤9:将F作为输入,结合支持向量回归技术,计算得到L的客观质量评价分数,记为Qpredict;其中,Qpredict越大,说明输入的F对应的光场图像的质量越好;反之,说明输入的F对应的光场图像的质量越差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110244734.4/1.html,转载请声明来源钻瓜专利网。