[发明专利]一种基于深度学习的超高清片源检测方法有效
申请号: | 201910825906.X | 申请日: | 2019-09-03 |
公开(公告)号: | CN110545416B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 周芸;胡潇;郭晓强;李小雨 | 申请(专利权)人: | 国家广播电视总局广播电视科学研究院 |
主分类号: | H04N17/02 | 分类号: | H04N17/02;H04N7/015;G06T7/00;G06K9/46 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王利文 |
地址: | 100886 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 超高 片源 检测 方法 | ||
1.一种基于深度学习的超高清片源检测方法,其特征在于包括以下步骤:
步骤1、对超高清片源进行技术符合性检测;
步骤2、对视频文件封装格式进行检测;
步骤3、对文件格式解封装后的码流文件进行检测;
步骤4、构造色域检测的卷积神经网络模型,对视频片源的色域进行检测;
步骤5、构造转换曲线检测的卷积神经网络模型,对视频片源的转换曲线进行检测;
所述超高清片源的技术参数需满足:分辨率为3840x2160和7680x4320,帧率为50P及以上,量化精度为10bit和12bit,色域为BT.2020,转换曲线为PQ和HLG两种;
所述步骤2的视频文件封装格式包括制播域的MXF格式和传输域的TS格式,具体检测检测方法为:
对于MXF格式,文件头中包含视频相关的元数据,包括分辨率、帧率、量化精度、编码方式信息,以及通过图像实体描述符记录与色域和HDR相关的转换曲线、颜色转换矩阵和色域;
对于TS格式,文件头中含有与编码方式相关的stream_type和相关描述符,用于确定所封装视频的编码格式;
所述步骤3的检测内容包括编码类和级、分辨率、帧率、量化精度的视频编码技术指标,以及与动态范围和色域相关的转换曲线、彩色信号转换矩阵的序列头标识信息;具体检测方法包括以下步骤:⑴对文件格式解封装后,得到编码基本流,编码基本流包含编码类和级、分辨率、帧率、量化精度的视频编码技术指标,与动态范围和色域相关的转换曲线、彩色信号转换矩阵在序列头信息中标识;⑵对于H.264/AVC编码和H.265/HEVC编码,在序列头VUI的vui_parameters()语法中对色域、转换曲线和颜色转换矩阵字段进行标识;⑶对于AVS2编码,在序列头的sequence_display_extension()语法中对色域、转换曲线和颜色转换矩阵字段进行标识:
所述步骤4的检测内容包括BT.709和BT.2020两种色域类别;具体检测方法为:首先将BT.709和BT.2020的图像划分为统一的像素尺寸,然后批量地输入卷积神经网络进行训练,经过多次迭代,得到色域分类网络模型:
所述步骤5的检测内容包括Gamma、HLG、PQ三种转换曲线类别;
所述步骤5构建转换曲线检测的卷积神经网络模型的方法为:首先将Gamma、HLG和PQ的图像划分为统一尺寸的图像块,然后批量地馈送入神经网络进行训练,经过多次迭代,得到转换曲线分类网络模型。
2.根据权利要求1所述的一种基于深度学习的超高清片源检测方法,其特征在于:所述步骤1的技术符合性检测包括文件格式检测、编码码流格式检测和内容特征检测,所述内容特征检测包括色域检测和转换曲线检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家广播电视总局广播电视科学研究院,未经国家广播电视总局广播电视科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910825906.X/1.html,转载请声明来源钻瓜专利网。