[发明专利]一种基于全景显著性的立体全景视频快速编码方法有效
申请号: | 202010175774.3 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111464805B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 杜宝祯;蒋刚毅;郁梅;郑雪蕾;晁涌 | 申请(专利权)人: | 宁波大学 |
主分类号: | H04N13/161 | 分类号: | H04N13/161 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全景 显著 立体 视频 快速 编码 方法 | ||
1.一种基于全景显著性的立体全景视频快速编码方法,其特征在于包括以下步骤:
步骤1:将ERP投影格式的立体全景视频中当前待处理的除第1帧以外的右视点视频帧定义为当前帧;其中,当前帧的宽度为W且高度为H;
步骤2:对当前帧进行显著性计算,得到当前帧的3D-Sobel显著图;
步骤3:将当前帧中当前待处理的最大编码单元定义为当前最大编码单元;其中,当前最大编码单元的尺寸为64×64;
步骤4:判断当前最大编码单元是否为当前帧中最上侧或最左侧的最大编码单元,如果是,则采用3D-HEVC视频编码器对当前最大编码单元进行编码,再执行步骤11;否则,执行步骤5;
步骤5:计算当前帧的3D-Sobel显著图中与当前最大编码单元对应的尺寸为64×64的区域的显著性强度,记为SILCU;并计算当前帧的3D-Sobel显著图中与当前最大编码单元对应的尺寸为64×64的区域的全景显著性阈值,记为THS;然后判断SILCU≥THS是否满足,如果满足,则判定当前最大编码单元为显著块,将当前最大编码单元重新定义为当前编码单元,然后执行步骤9;如果不满足,则判定当前最大编码单元为非显著块,然后执行步骤6;
步骤6:令DLCU(View)表示当前帧对应的左视点视频帧中与当前最大编码单元对应的已编码最大编码单元的最优递归深度均值,令DLCU(Col)表示当前帧的前一帧右视点视频帧中与当前最大编码单元对应的已编码最大编码单元的最优递归深度均值,令DLCU(LT)表示当前最大编码单元的已编码左上侧最大编码单元的最优递归深度均值,令DLCU(L)表示当前最大编码单元的已编码左侧最大编码单元的最优递归深度均值,令DLCU(T)表示当前最大编码单元的已编码上侧最大编码单元的最优递归深度均值;然后预测当前最大编码单元的递归深度区间,记为[Dmin,Dmax],其中,Dmin表示当前最大编码单元的最小划分深度,Dmax表示当前最大编码单元的最大划分深度,min()为取最小值函数,max()为取最大值函数,符号为向下取整符号,符号为向上取整符号;
步骤7:跳转到以当前最大编码单元为根节点的四叉树结构中划分深度为Dmin的CU层,采用3D-HEVC视频编码器对该CU层中的所有编码单元以深度优先遍历的方式进行编码,针对该CU层中的任一个编码单元,将其作为当前编码单元,在当前编码单元编码后先判断当前编码单元的最大划分深度是否已达到Dmax或当前编码单元的最大划分深度是否已达到3,如果已达到,则继续以深度优先遍历的方式对当前编码单元的未编码的兄弟节点进行编码,直至当前编码单元的所有兄弟节点编码完成,再执行步骤11;如果未达到,则执行步骤8;
步骤8:计算当前帧的3D-Sobel显著图中与当前编码单元对应的区域的显著性强度,记为SICU,然后比较SICU与SILCU,如果SICU>SILCU,则计算当前编码单元的递归深度区间,记为[Dmin,D′max],然后令Dmax=D′max,再返回步骤7继续执行;如果SICU≤SILCU,则计算当前编码单元的递归深度区间,记为[Dmin,D″max],然后令Dmax=D″max,再返回步骤7继续执行;其中,DCU(View)表示当前帧对应的左视点视频帧中与当前编码单元对应的已编码的编码单元的最优递归深度均值,DCU(Col)表示当前帧的前一帧右视点视频帧中与当前编码单元对应的已编码的编码单元的最优递归深度均值,DCU(LT)表示当前编码单元的已编码左上侧编码单元的最优递归深度均值,DCU(L)表示当前编码单元的已编码左侧编码单元的最优递归深度均值,DCU(T)表示当前编码单元的已编码上侧编码单元的最优递归深度均值;
步骤9:利用BJND模型计算当前编码单元的感知失真均方根误差,记为MSEBjnd;并计算当前编码单元的统计均方根误差,记为MSES,再计算得到基于全景感知失真的编码单元划分阈值,记为THsplit,THsplit=η1MSES+η2MSEBjnd;其中,e表示自然基数,k为斜率,取值为-2.3334,Qstep表示当前编码单元的量化步长,QP表示当前编码单元的量化参数,MSECol表示当前帧的前一帧中与当前编码单元对应的已编码的编码单元的均方根误差,表示当前帧的前一帧中与当前编码单元对应的已编码的编码单元的量化步长,QPCol表示当前帧的前一帧中与当前编码单元对应的已编码的编码单元的量化参数,b表示截距,取值为6.3751,N×N表示当前编码单元的尺寸,N的值为64或32或16或8,η1和η2均为调节因子,η1+η2=1;
步骤10:计算当前编码单元的均方根误差,记为MSECur;然后比较MSECur与THsplit的大小,若MSECur≤THsplit,则认为当前编码单元已达到最优划分深度,不需要再进一步划分,采用3D-HEVC视频编码器对当前编码单元进行编码,再执行步骤11;若MSECur>THsplit,则跳转到以当前最大编码单元为根节点的四叉树结构中划分深度为Dmin的CU层,采用3D-HEVC视频编码器对该CU层中的所有编码单元以深度优先遍历的方式进行编码,针对该CU层中的任一个编码单元,将其作为当前编码单元,然后返回步骤9继续执行,直至当前编码单元的所有兄弟节点编码完成,再执行步骤11;
步骤11:将当前帧中下一个待处理的最大编码单元作为当前最大编码单元,然后返回步骤4继续执行,直至当前帧中的所有最大编码单元均处理完毕,之后执行步骤12;
步骤12:将ERP投影格式的立体全景视频中下一帧待处理的右视点视频帧作为当前帧,然后返回步骤2继续执行,直至ERP投影格式的立体全景视频中的所有视频帧均处理完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010175774.3/1.html,转载请声明来源钻瓜专利网。