[发明专利]一种基于深度学习的自适应视频编码方法有效
申请号: | 201910714608.3 | 申请日: | 2019-08-06 |
公开(公告)号: | CN110401834B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 庄育珊;许祝登;刘佳扬;刘宇新;朱政 | 申请(专利权)人: | 杭州微帧信息科技有限公司 |
主分类号: | H04N19/154 | 分类号: | H04N19/154;H04N19/149;H04N19/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种基于深度学习的自适应视频编码方法。所述方法包括以下步骤:利用多样化的视频资料库生成训练数据和测试数据;构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层;使用训练数据对深度学习的神经网络模型进行训练;使用测试数据对训练好的模型进行验证;应用所述神经网络模型得到预测的CRF |
||
搜索关键词: | 一种 基于 深度 学习 自适应 视频 编码 方法 | ||
【主权项】:
1.一种基于深度学习的自适应视频编码方法,其特征在于,包括以下步骤:(1)利用多样化的视频资料库生成训练数据和测试数据;(1.1)对样本视频数据使用不同的固定码率系数CRF进行压缩编码;(1.2)对每个已编码的视频按照一视频质量评价体系进行评分;(1.3)针对每个样本视频v,选取使得编码的视频能够达到一个满意的质量分数SCORE_TARGET的最大的CRF,记为CRFoptimal(v),当CRF设置为CRFoptimal(v)时,压缩的视频在达到一个满意的视觉效果的同时能够节省最多的码率;(1.4)把样本数据按照一定的比例随机分为训练数据和测试数据;(2)构建深度学习的神经网络模型;所述神经网络模型包括卷积神经网络CNN特征提取器、长短期记忆网络LSTM特征提取器、全连接层以及输出层,所述全连接层分别与所述CNN特征提取器、所述LSTM特征提取器、所述输出层相连;(2.1)所述CNN特征提取器通过CNN模型提取视频空间域的特征;(2.2)所述LSTM特征提取器通过LSTM模型来提取视频时间域的特征;(2.3)所述全连接层融合上述提取的视频空间域的特征和时间域的特征,进行CRFoptimal(v)的预测;(2.4)输出层的输出值为预测的CRFoptimal(v)的值;(2.5)计算所述神经网络模型的损失函数L2:
其中m表示样本的个数,
表示CRF的预测值,CRF(i)表示样本数据i的CRF实际值,
表示对样本数据i的预测值;利用所述损失函数L2对所述神经网络模型中各层的参数进行调整;(3)使用训练数据对深度学习的神经网络模型进行训练;(4)使用测试数据对训练好的模型进行验证;(5)应用所述构建的神经网络模型;(5.1)把输入视频作为输入送到训练好的深度学习的神经网络模型中;(5.2)在模型的输出端得到预测的CRFoptimal(v)的取值;(6)视频压缩:编码器对输入的视频v进行压缩编码,CRF设置为CRFoptimal(v),输出编码视频码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微帧信息科技有限公司,未经杭州微帧信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910714608.3/,转载请声明来源钻瓜专利网。