[发明专利]基于深度学习的3D-HEVC深度图编码单元快速决策方法在审

专利信息
申请号: 201910026936.4 申请日: 2019-01-11
公开(公告)号: CN109714584A 公开(公告)日: 2019-05-03
发明(设计)人: 张桦;於世芳;戴国骏;黄鸿飞;赵月;沈方瑶;周文晖 申请(专利权)人: 杭州电子科技大学
主分类号: H04N13/161 分类号: H04N13/161;H04N13/106;H04N19/182;H04N19/597;H04N19/91
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 朱月芬
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度学习的3D‑HEVC深度图编码单元尺寸快速决策方法。本发明首先利用官方传统方法,先统计测试序列前10帧的深度图编码单元的分割情况来建立数据库,再通过深度学习对这些数据集来进行训练,从而产生一个模型。最后利用该模型来判断测试序列完整帧的深度图编码单元是否需要继续分割。深度学习可以发现数据的分布式特征表示,利用深度学习训练出来的网络具有很强的判知能力,所以利用深度学习可以预知深度图编码单元是否需要继续分割。本发明可以降低编码过程中的计算复杂度,缩短编码时间,在视频重建上也有良好的效果。
搜索关键词: 深度图编码 快速决策 学习 分割 分布式特征 计算复杂度 建立数据库 编码过程 判断测试 视频重建 统计测试 学习训练 数据集 完整帧 网络 发现
【主权项】:
1.基于深度学习的3D‑HEVC深度图编码单元快速决策方法,其特征在于包括如下步骤:步骤1:提取训练数据集官方提供分辨率为1920*1088的GTFly、PoznanHall2、UndoDancer、PoznanStreet、Shark与分辨率为1024*768的Balloon、Kendo、Newspaper共8个测试序列;将GTFly、PoznanHall2、UndoDancer、Ballon、Kendo作为训练集,PoznanStreet、Shark、Newspaper作为测试集;具体的:提取分辨率为1920*1088的GTFly、PoznanHall2、UndoDancer测试序列的前10帧图像组的64*64尺寸的深度图像素矩阵和分辨率为1024*768的Balloon、Kendo的测试序列的前26帧图像组的64*64尺寸的深度图像素矩阵作为训练集;训练集的深度图编码单元是否分割的标签通过逐级比较RD‑COST的大小得到,即若分割后的RD‑COST小于等于分割前的RD‑COST,则设置标签为1,表示分割;若分割后的RD‑COST大于分割前的RD‑COST,则设置标签为0,表示不分割;步骤2:训练集的预处理将采集的64*64的深度图像素矩阵复制为3份,对这三个矩阵分别做不同的预处理;分别得到三个不同归一化处理的64*64的矩阵,作为卷积神经网络的输入;步骤3:构建卷积神经网络,包括:构建深度卷积神经网络,并设计损失函数,将得到的不同归一化处理后的64*64的矩阵输入到卷积神经网络中,调整参数,从而得到深度图编码单元是否分割的特征模型;步骤4:卷积神经网络模型输出分类结果通过卷积神经网络模型的训练,可以得到尺寸为64*64、32*32、16*16的深度图编码单元是否分割的判断依据;将得到的判断依据模型加载到卷积神经网络模型,可作为判断深度图是否继续分割的标准。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910026936.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top