[发明专利]一种基于深度学习的自适应视频编码方法有效

专利信息
申请号: 201910714608.3 申请日: 2019-08-06
公开(公告)号: CN110401834B 公开(公告)日: 2021-07-27
发明(设计)人: 庄育珊;许祝登;刘佳扬;刘宇新;朱政 申请(专利权)人: 杭州微帧信息科技有限公司
主分类号: H04N19/154 分类号: H04N19/154;H04N19/149;H04N19/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 310012 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度学习的自适应视频编码方法。所述方法包括以下步骤:利用多样化的视频资料库生成训练数据和测试数据;构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层;使用训练数据对深度学习的神经网络模型进行训练;使用测试数据对训练好的模型进行验证;应用所述神经网络模型得到预测的CRFoptimal(v)的取值;根据得到的CRFoptimal(v)进行视频压缩。该方法对每个视频较准确地预测满足视频质量评价分数的编码参数,从而实现满足用户体验前提下视频编码的码率自适应。
搜索关键词: 一种 基于 深度 学习 自适应 视频 编码 方法
【主权项】:
1.一种基于深度学习的自适应视频编码方法,其特征在于,包括以下步骤:(1)利用多样化的视频资料库生成训练数据和测试数据;(1.1)对样本视频数据使用不同的固定码率系数CRF进行压缩编码;(1.2)对每个已编码的视频按照一视频质量评价体系进行评分;(1.3)针对每个样本视频v,选取使得编码的视频能够达到一个满意的质量分数SCORE_TARGET的最大的CRF,记为CRFoptimal(v),当CRF设置为CRFoptimal(v)时,压缩的视频在达到一个满意的视觉效果的同时能够节省最多的码率;(1.4)把样本数据按照一定的比例随机分为训练数据和测试数据;(2)构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层,所述全连接层分别与所述CNN特征提取器、所述LSTM特征提取器、所述输出层相连;(2.1)所述CNN特征提取器通过CNN模型提取视频空间域的特征;(2.2)所述LSTM特征提取器通过LSTM模型来提取视频时间域的特征;(2.3)所述全连接层融合上述提取的视频空间域的特征和时间域的特征,进行CRFoptimal(v)的预测;(2.4)输出层的输出值为预测的CRFoptimal(v)的值;(2.5)计算所述神经网络模型的损失函数L2其中m表示样本的个数,表示CRF的预测值,CRF(i)表示样本数据i的CRF实际值,表示对样本数据i的预测值;利用所述损失函数L2对所述神经网络模型中各层的参数进行调整;(3)使用训练数据对深度学习的神经网络模型进行训练;(4)使用测试数据对训练好的模型进行验证;(5)应用所述构建的神经网络模型;(5.1)把输入视频作为输入送到训练好的深度学习的神经网络模型中;(5.2)在模型的输出端得到预测的CRFoptimal(v)的取值;(6)视频压缩:编码器对输入的视频v进行压缩编码,CRF设置为CRFoptimal(v),输出编码视频码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微帧信息科技有限公司,未经杭州微帧信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910714608.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top