[发明专利]基于K均值聚类的深度图编码方法有效

申请号：	201510306260.6	申请日：	2015-06-05
公开（公告）号：	CN104883558B	公开（公告）日：	2017-05-24
发明（设计）人：	王安红;刘瑞珍	申请（专利权）人：	太原科技大学
主分类号：	H04N13/00	分类号：	H04N13/00;H04N19/597
代理公司：	太原市科瑞达专利代理有限公司14101	代理人：	王思俊
地址：	030024 山***	国省代码：	山西;14
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于均值深度编码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于3D视频中深度图的编解码领域，具体涉及一种基于聚类的深度图编码方法。

背景技术

目前，由于三维视频中用户可以自由选择观看的视角和立体感知能力,三维视频成为了视频编码及通信领域的研究热点。“多视点视频+深度”即MVD格式是目前普遍采用的三维视频表示方法，MVD是在原有多视点视频的基础上给每个视频信号增加了深度序列，深度图仅仅是用来进行视点合成的，而不直接显示给用户观看，深度图结合其所对应的纹理图可以用来合成任意位置虚拟视点的图像，深度图的失真会导致合成视点的色度或亮度的失真，也会导致虚拟合成视点图像的几何失真，从而影响合成虚拟视点的质量。由于深度图像有与纹理图像截然不同的性质，传统的图像编码标准例如JPEG和JPEG2000等都是对深度图进行分块处理，但是由于深度图是由边界和平滑区域所构成的，传统的规则块的处理方法对深度图的边界会有损伤，因此不能极其有效的对深度图进行编码压缩。同时，由于深度图像和纹理图像在特性上的不同，所以适用于纹理图像编码的帧内预测、率失真优化准则和DCT变换等压缩技术也不能直接用来进行深度图像的压缩。为解决这些挑战，Krishnamurthy等人提出了一种基于感兴趣区域ROI的编码方案，可以有效的减小深度图边缘的失真；G.Shen等人提出了一种新的方法用以取代传统的DCT变换，即边缘自适应变换EAT通过这种方法也可以有效的减少边缘的失真，从而较好的保持了深度图像的边缘。然而，目前的这些方法中，对深度图不同于纹理图像的特性分析仍然不充分，比如在深度图内没有任何物体表面的纹理信息，这就使得一个物体内部所包含的区域有极为相似的深度值，只是在物体的边缘呈现出尖锐的边缘，且有明显的灰度级差别，并且在MVD的结构中，每幅彩色图像都有其对应的深度图像，且深度图在虚拟视点的合成和显示中起到了至关重要的作用，深度图像数据量巨大，因此传输的时候带宽压力也大，目前所使用的深度图编码方案性能欠佳，且不能很好的保证深度图的边缘完整性。

发明内容

本发明的目的是提供一种基于K均值聚类的深度图编码方法，能够有效提高利用解码的深度图与其对应的纹理图所合成的虚拟视点图像质量。

本发明是这样实现的，其特征包括下列步骤：

(1).读入一幅深度图，根据聚类级数level和聚类中心C的不同设定将深度图聚为n类，n为正整数，聚类之后读入的深度图被分割为n幅新的图像，具体做法是：设一个与原图像相同维数的零矩阵A1，将聚类之后第一类中的像素点对应位置的原深度值赋值到零矩阵A1中，从而形成第1幅新的深度图D1，如此反复，直到所有的类都执行完毕就得到第1、第2、...、第n幅不同的深度图D1、D2、...、Dn；

(2).对得到的新的第1、第2、...、第n幅深度图D1、D2、...、Dn分别进行操作：

a：边缘检测：首先对第1幅深度图D1进行边缘检测，在边缘检测的过程中，如果一个非零像素点周围8个方向位置上的像素值有一个为零，则将这个像素点定义为边界点，反之如果8个方向位置上的像素值都不为零，则定义为非边界点，通过这种方法得到第1幅深度图D1的边界点，且通过边界点将第1幅深度图D1分为两部分，即边界区域和非边界区域；

b：边界区域的编码：包括边界位置和边界像素点的编码：

b1：边界位置的编码：设一个与原图像维数大小相同的零矩阵B，并将形成的第1、第2、...、第n幅新的深度图D1、D2、...、Dn中非零的像素值在零矩阵B中对应的位置依次标记为0、1、...、m，m为正整数，然后对更新后的零矩阵B进行游程编码，在解码端得到n类深度图数据的对应位置；

b2：边界像素点的编码：通过边缘检测得到第1幅深度图D1的边界点，将其取出放入到一个一维矢量中进行差值运算，通过公式(1)进行：

d(x+1)＝e(x+1)-e(x)(1)

式中，e代表的是一维矢量中的元素即边界位置的像素值，x代表的是一维矢量中每个元素对应的位置，在上式中x是正整数，d(x+1)代表的是一维矢量中后一个位置(x+1位置)的像素值减前一个位置(x位置)的像素值，是一个残差矢量，最后将残差矢量进行算术编码并传送到解码端；

c：非边界区域的编码：对于第1幅深度图D1去除边界点之后剩余的像素点，首先将其取出并放入一个一维矢量中，然后对其进行下采样，在下采样的过程中，其步长QP＝1,2,3，...，QP为正整数，最后将下采样得到的值进行熵编码并传送到解码端；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于太原科技大学，未经太原科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510306260.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于网络通信的视频文件检索方法
下一篇：一种开路电视信号远端多点位实时回传监视系统

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N13-00 立体电视系统；其零部件
H04N13-02 .图像信号发生器
H04N13-04 .图像重现装置

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于K均值聚类的深度图编码方法有效

专利文献下载