[发明专利]一种基于对象的立体图像深度调整方法有效
申请号: | 201810371453.3 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108810512B | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 邵枫;费延佳;李福翠 | 申请(专利权)人: | 宁波大学 |
主分类号: | H04N13/128 | 分类号: | H04N13/128;H04N13/122 |
代理公司: | 宁波奥圣专利代理事务所(普通合伙) 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 立体图像 深度调整 舒适性 矩阵 四边形网格 右视点图像 左视点图像 背景区域 边缘保持 对象控制 对象形状 深度控制 相似变换 重要内容 重要区域 坐标位置 形变 特征点 自适应 总能量 缩放 保留 优化 保证 | ||
1.一种基于对象的立体图像深度调整方法,其特征在于包括以下步骤:
步骤一:将待处理的宽度为W且高度为H的立体图像的左视点图像、右视点图像及左视差图像对应记为{L(x,y)}、{R(x,y)}及{dL(x,y)};其中,1≤x≤W,1≤y≤H,W和H均能被8整除,L(x,y)表示{L(x,y)}中坐标位置为(x,y)的像素点的像素值,R(x,y)表示{R(x,y)}中坐标位置为(x,y)的像素点的像素值,dL(x,y)表示{dL(x,y)}中坐标位置为(x,y)的像素点的像素值;
步骤二:将{L(x,y)}分割成个互不重叠的尺寸大小为8×8的四边形网格,将{L(x,y)}中的第k个四边形网格记为UL,k,并将{L(x,y)}中的所有四边形网格构成的集合记为VL,VL={UL,k|1≤k≤M};然后根据{L(x,y)}中的所有四边形网格和{dL(x,y)},获取{R(x,y)}中的所有互不重叠的尺寸大小为8×8的四边形网格,将{R(x,y)}中的第k个四边形网格记为UR,k,并将{R(x,y)}中的所有四边形网格构成的集合记为VR,VR={UR,k|1≤k≤M};其中,k为正整数,1≤k≤M,M表示{L(x,y)}中包含的四边形网格的总个数,也表示{R(x,y)}中包含的四边形网格的总个数,UL,k通过其左上、左下、右上和右下4个网格顶点的集合来描述,对应表示UL,k的作为第1个网格顶点的左上网格顶点、作为第2个网格顶点的左下网格顶点、作为第3个网格顶点的右上网格顶点、作为第4个网格顶点的右下网格顶点,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,UR,k通过其左上、左下、右上和右下4个网格顶点的集合来描述,对应表示UR,k的作为第1个网格顶点的左上网格顶点、作为第2个网格顶点的左下网格顶点、作为第3个网格顶点的右上网格顶点、作为第4个网格顶点的右下网格顶点,以的水平坐标位置和垂直坐标位置来描述,表示{dL(x,y)}中坐标位置为的像素点的像素值,以的水平坐标位置和垂直坐标位置来描述,表示{dL(x,y)}中坐标位置为的像素点的像素值,以的水平坐标位置和垂直坐标位置来描述,表示{dL(x,y)}中坐标位置为的像素点的像素值,以的水平坐标位置和垂直坐标位置来描述,表示{dL(x,y)}中坐标位置为的像素点的像素值;
采用尺度不变特征转换提取出{L(x,y)}中的所有特征点;然后将{L(x,y)}中的第q个特征点记为接着根据{L(x,y)}中的每个特征点和{dL(x,y)},获取{R(x,y)}中与{L(x,y)}中的每个特征点匹配的特征点,将{R(x,y)}中与匹配的特征点记为其中,q为正整数,1≤q≤Q,Q表示{L(x,y)}中的特征点的总个数,也表示{R(x,y)}中的特征点的总个数,表示的横坐标位置,表示的纵坐标位置,表示的横坐标位置,表示{dL(x,y)}中坐标位置为的像素点的像素值,表示的纵坐标位置,
步骤三:根据{L(x,y)}中的每个四边形网格的所有网格顶点的边缘组成的矩阵和{L(x,y)}中的每个四边形网格对应的目标四边形网格的所有网格顶点的边缘组成的矩阵、{R(x,y)}中的每个四边形网格的所有网格顶点的边缘组成的矩阵和{R(x,y)}中的每个四边形网格对应的目标四边形网格的所有网格顶点的边缘组成的矩阵,计算{L(x,y)}和{R(x,y)}中的所有四边形网格对应的目标四边形网格的总边缘保持能量,记为Eedge;
根据用户选择的重要内容,计算{L(x,y)}和{R(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有四边形网格对应的目标四边形网格的总对象控制能量,记为Eobject;
根据{L(x,y)}和{R(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有特征点,计算{L(x,y)}和{R(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有四边形网格对应的目标四边形网格的总深度控制能量,记为Edepth;
根据{L(x,y)}中落于背景区域内的所有特征点和对应的目标特征点、{R(x,y)}中落于背景区域内的所有特征点和对应的目标特征点,计算{L(x,y)}和{R(x,y)}中落于背景区域内的所有四边形网格对应的目标四边形网格的总背景保持能量,记为Eback;其中,背景区域为除用户选择的重要内容所在的矩形区域外的区域;
步骤四:根据Eedge、Eobject、Edepth和Eback,计算{L(x,y)}和{R(x,y)}中的所有四边形网格对应的目标四边形网格的总能量,记为Etotal,Etotal=Eedge+λobject×Eobject+λdepth×Edepth+λback×Eback;然后通过最小二乘优化求解得到{L(x,y)}中的所有四边形网格对应的最佳目标四边形网格构成的集合及{R(x,y)}中的所有四边形网格对应的最佳目标四边形网格构成的集合,对应记为及接着根据计算{L(x,y)}中的每个四边形网格对应的最佳目标四边形网格的最佳相似变换矩阵,将UL,k对应的最佳目标四边形网格的最佳相似变换矩阵记为并根据计算{R(x,y)}中的每个四边形网格对应的最佳目标四边形网格的最佳相似变换矩阵,将UR,k对应的最佳目标四边形网格的最佳相似变换矩阵记为其中,λobject为Eobject的加权参数,λdepth为Edepth的加权参数,λback为Eback的加权参数,min()为取最小值函数,表示{L(x,y)}中的所有四边形网格对应的目标四边形网格构成的集合,表示{R(x,y)}中的所有四边形网格对应的目标四边形网格构成的集合,表示UL,k对应的最佳目标四边形网格,对应表示的第1个网格顶点、第2个网格顶点、第3个网格顶点、第4个网格顶点,表示UR,k对应的最佳目标四边形网格,对应表示的第1个网格顶点、第2个网格顶点、第3个网格顶点、第4个网格顶点,(AL,k)T为AL,k的转置,((AL,k)TAL,k)-1为(AL,k)TAL,k的逆,和对应表示的水平坐标位置和垂直坐标位置,和对应表示的水平坐标位置和垂直坐标位置,和对应表示的水平坐标位置和垂直坐标位置,和对应表示的水平坐标位置和垂直坐标位置,(AR,k)T为AR,k的转置,((AR,k)TAR,k)-1为(AR,k)TAR,k的逆,和对应表示的水平坐标位置和垂直坐标位置,和对应表示的水平坐标位置和垂直坐标位置,和对应表示的水平坐标位置和垂直坐标位置,和对应表示的水平坐标位置和垂直坐标位置;
步骤五:根据{L(x,y)}中的每个四边形网格对应的最佳目标四边形网格的最佳相似变换矩阵,计算{L(x,y)}中的每个四边形网格中的每个像素点经最佳相似变换矩形变换后的水平坐标位置和垂直坐标位置,将UL,k中水平坐标位置为x'L,k和垂直坐标位置y'L,k的像素点经最佳相似变换矩阵变换后的水平坐标位置和垂直坐标位置对应记为和然后根据{L(x,y)}中的每个四边形网格中的每个像素点经最佳相似变换矩形变换后的水平坐标位置和垂直坐标位置,获取深度调整后的左视点图像,记为其中,1≤x'L,k≤W,1≤y'L,k≤H,1≤x'≤W',1≤y'≤H,W'表示深度调整后的立体图像的宽度,H亦为深度调整后的立体图像的高度,表示中坐标位置为(x',y')的像素点的像素值;
同样,根据{R(x,y)}中的每个四边形网格对应的最佳目标四边形网格的最佳相似变换矩阵,计算{R(x,y)}中的每个四边形网格中的每个像素点经最佳相似变换矩形变换后的水平坐标位置和垂直坐标位置,将UR,k中水平坐标位置为x'R,k和垂直坐标位置y'R,k的像素点经最佳相似变换矩阵变换后的水平坐标位置和垂直坐标位置对应记为和然后根据{R(x,y)}中的每个四边形网格中的每个像素点经最佳相似变换矩形变换后的水平坐标位置和垂直坐标位置,获取深度调整后的右视点图像,记为其中,1≤x'R,k≤W,1≤y'R,k≤H,1≤x'≤W',1≤y'≤H,表示中坐标位置为(x',y')的像素点的像素值;
所述的步骤三中的Eedge的计算过程为:
A1、计算{L(x,y)}中的所有四边形网格对应的目标四边形网格的边缘保持能量,记为其中,eL,k表示UL,k的所有网格顶点的边缘组成的矩阵,(eL,k)T为eL,k的转置,((eL,k)TeL,k)-1为(eL,k)TeL,k的逆,表示的所有网格顶点的边缘组成的矩阵,表示UL,k对应的目标四边形网格,通过其左上、左下、右上和右下4个网格顶点的集合来描述,对应表示的作为第1个网格顶点的左上网格顶点、作为第2个网格顶点的左下网格顶点、作为第3个网格顶点的右上网格顶点、作为第4个网格顶点的右下网格顶点,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,符号“|| ||”为求欧氏距离符号;
同样,计算{R(x,y)}中的所有四边形网格对应的目标四边形网格的边缘保持能量,记为其中,eR,k表示UR,k的所有网格顶点的边缘组成的矩阵,(eR,k)T为eR,k的转置,((eR,k)TeR,k)-1为(eR,k)TeR,k的逆,表示的所有网格顶点的边缘组成的矩阵,表示UR,k对应的目标四边形网格,通过其左上、左下、右上和右下4个网格顶点的集合来描述,对应表示的作为第1个网格顶点的左上网格顶点、作为第2个网格顶点的左下网格顶点、作为第3个网格顶点的右上网格顶点、作为第4个网格顶点的右下网格顶点,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,以的水平坐标位置和垂直坐标位置来描述,
A2、根据和计算{L(x,y)}和{R(x,y)}中的所有四边形网格对应的目标四边形网格的总边缘保持能量Eedge,
所述的步骤三中的Edepth的计算过程为:
B1、计算{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有特征点的舒适度保持能量,记为Ecomfort,其中,表示{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有特征点重新编号后的序号构成的集合,表示{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的第p个特征点的深度值,exp()表示以自然基数e为底的指数函数,符号“| |”为取绝对值符号,Zmax表示{L(x,y)}的最大深度值,Zmin表示{L(x,y)}的最小深度值,CVZmin表示最小舒适观看区域范围,He表示待处理的立体图像的左视点与右视点之间的水平基线距离,D表示待处理的立体图像的左视点和右视点与显示器之间的观看距离,Wd表示显示器的水平宽度,Rd表示显示器的水平分辨率,η1表示最小舒适观看视角,CVZmax表示最大舒适观看区域范围,η2表示最大舒适观看视角,表示{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的第p个特征点的视差值,也表示{dL(x,y)}中坐标位置为落于用户选择的重要内容所在的矩形区域内的第p个特征点的像素点的像素值,表示的目标深度值;
B2、计算{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有特征点的特征保持能量,记为Efeature,其中,表示{L(x,y)}中落于用户选择的重要内容所在的矩形区域内与该矩形区域内的第p个特征点相邻的八邻域范围内的所有特征点重新编号后的序号构成的集合,表示{L(x,y)}中落于用户选择的重要内容所在的矩形区域内与该矩形区域内的第p个特征点相邻的八邻域范围内的第p'个特征点的深度值,表示的目标深度值;
B3、通过求解min(Ecomfort+λfeature×Efeature),得到{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有特征点的最佳目标深度值集合,记为为的最佳目标深度值;然后根据获取{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有特征点的最佳目标视差值集合,记为为的最佳目标视差值,其中,min()为取最小值函数,λfeature为Efeature的加权参数;
B4、根据计算{L(x,y)}和{R(x,y)}中落于用户选择的重要内容所在的矩形区域内的所有四边形网格对应的目标四边形网格的总深度控制能量Edepth,其中,符号“|| ||”为求欧氏距离符号,表示{L(x,y)}中落于用户选择的重要内容所在的矩形区域内的第p个特征点,表示{R(x,y)}中落于用户选择的重要内容所在的矩形区域内的第p个特征点,表示对应的目标特征点,表示对应的目标特征点,表示的横坐标位置,表示的横坐标位置,表示的横坐标位置,表示的横坐标位置,1≤i'≤4,1≤k'≤M,表示所在的四边形网格UL,k'的第i'个网格顶点,UL,k'为{L(x,y)}中的第k'个四边形网格,表示所在的四边形网格UL,k'的作为第1个网格顶点的左上网格顶点,表示所在的四边形网格UL,k'的作为第2个网格顶点的左下网格顶点,表示所在的四边形网格UL,k'的作为第3个网格顶点的右上网格顶点,表示所在的四边形网格UL,k'的作为第4个网格顶点的右下网格顶点,表示与之间的欧氏距离,表示所在的目标四边形网格的第i'个网格顶点,为UL,k'对应的目标四边形网格,表示所在的目标四边形网格的作为第1个网格顶点的左上网格顶点,表示所在的目标四边形网格的作为第2个网格顶点的左下网格顶点,表示所在的目标四边形网格的作为第3个网格顶点的右上网格顶点,表示所在的目标四边形网格的作为第4个网格顶点的右下网格顶点,表示所在的四边形网格UR,k'的第i'个网格顶点,UR,k'为{R(x,y)}中的第k'个四边形网格,表示所在的四边形网格UR,k'的作为第1个网格顶点的左上网格顶点,表示所在的四边形网格UR,k'的作为第2个网格顶点的左下网格顶点,表示所在的四边形网格UR,k'的作为第3个网格顶点的右上网格顶点,表示所在的四边形网格UR,k'的作为第4个网格顶点的右下网格顶点,表示与之间的欧氏距离,表示所在的目标四边形网格的第i'个网格顶点,为UR,k'对应的目标四边形网格,表示特征点所在的目标四边形网格的作为第1个网格顶点的左上网格顶点,表示所在的目标四边形网格的作为第2个网格顶点的左下网格顶点,表示所在的目标四边形网格的作为第3个网格顶点的右上网格顶点,表示特征点所在的目标四边形网格的作为第4个网格顶点的右下网格顶点;
所述的步骤三中的Eback的计算过程为:其中,表示{L(x,y)}和{R(x,y)}中落于背景区域内的所有特征点重新编号后的序号构成的集合,表示{L(x,y)}中落于背景区域内的第g个特征点,表示{R(x,y)}中落于背景区域内的第g个特征点,表示对应的目标特征点,表示对应的目标特征点,符号“|| ||”为求欧氏距离符号,1≤i'≤4,1≤k”≤M,表示所在的四边形网格UL,k”的第i'个网格顶点,UL,k”为{L(x,y)}中的第k”个四边形网格,表示所在的四边形网格UL,k”的作为第1个网格顶点的左上网格顶点,表示所在的四边形网格UL,k”的作为第2个网格顶点的左下网格顶点,表示所在的四边形网格UL,k”的作为第3个网格顶点的右上网格顶点,表示所在的四边形网格UL,k”的作为第4个网格顶点的右下网格顶点,表示与之间的欧氏距离,表示所在的目标四边形网格的第i'个网格顶点,为UL,k”对应的目标四边形网格,表示所在的目标四边形网格的作为第1个网格顶点的左上网格顶点,表示所在的目标四边形网格的作为第2个网格顶点的左下网格顶点,表示所在的目标四边形网格的作为第3个网格顶点的右上网格顶点,表示所在的目标四边形网格的作为第4个网格顶点的右下网格顶点,表示所在的四边形网格UR,k”的第i'个网格顶点,UR,k”为{R(x,y)}中的第k”个四边形网格,表示所在的四边形网格UR,k”的作为第1个网格顶点的左上网格顶点,表示所在的四边形网格UR,k”的作为第2个网格顶点的左下网格顶点,表示所在的四边形网格UR,k”的作为第3个网格顶点的右上网格顶点,表示所在的四边形网格UR,k”的作为第4个网格顶点的右下网格顶点,表示与之间的欧氏距离,表示所在的目标四边形网格的第i'个网格顶点,为UR,k”对应的目标四边形网格,表示所在的目标四边形网格的作为第1个网格顶点的左上网格顶点,表示特征点所在的目标四边形网格的作为第2个网格顶点的左下网格顶点,表示特征点所在的目标四边形网格的作为第3个网格顶点的右上网格顶点,表示特征点所在的目标四边形网格的作为第4个网格顶点的右下网格顶点;
所述的步骤三中的Eobject的计算过程为:
其中,表示用户选择的重要内容所在的矩形区域范围,表示{L(x,y)}中在水平方向为第j个且在垂直方向为第i个的网格顶点的水平坐标位置,表示{L(x,y)}中在水平方向为第j+1个且在垂直方向为第i个的网格顶点的水平坐标位置,表示{L(x,y)}中在水平方向为第j个且在垂直方向为第i个的网格顶点在目标四边形网格中的网格顶点的水平坐标位置,表示{L(x,y)}中在水平方向为第j+1个且在垂直方向为第i个的网格顶点在目标四边形网格中的网格顶点的水平坐标位置,表示{R(x,y)}中在水平方向为第j个且在垂直方向为第i个的网格顶点的水平坐标位置,表示{R(x,y)}中在水平方向为第j+1个且在垂直方向为第i个的网格顶点的水平坐标位置,表示{R(x,y)}中在水平方向为第j个且在垂直方向为第i个的网格顶点在目标四边形网格中的网格顶点的水平坐标位置,表示{R(x,y)}中在水平方向为第j+1个且在垂直方向为第i个的网格顶点在目标四边形网格中的网格顶点的水平坐标位置,sx表示用户指定的重要内容的水平缩放因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810371453.3/1.html,转载请声明来源钻瓜专利网。