[发明专利]基于时空复杂性度量及局部预测残差分布的HEVC双压缩视频检测方法有效
申请号: | 201910201618.7 | 申请日: | 2019-03-16 |
公开(公告)号: | CN109982071B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 何沛松;王宏霞;刘嘉勇 | 申请(专利权)人: | 四川大学 |
主分类号: | H04N17/00 | 分类号: | H04N17/00;H04N19/177 |
代理公司: | 成都盈信专利代理事务所(普通合伙) 51245 | 代理人: | 张澎 |
地址: | 610065 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时空 复杂性 度量 局部 预测 分布 hevc 压缩 视频 检测 方法 | ||
1.一种基于时空复杂性度量及局部区域的预测残差强度分布的HEVC双压缩视频检测方法,其特征在于,包括如下步骤:
步骤1:将输入视频解压缩为帧序列,计算每帧的关键点并对相邻两帧进行关键点匹配;
步骤2:对每个视频帧的匹配关键点,计算以关键点为中心的局部区域时空复杂性度量;
步骤3:对每个视频帧的匹配关键点根据时空复杂性度量进行排序,并剔除具有空间聚合关系的关键点;
步骤4:对每帧剩下的关键点,统计以关键点为中心的局部区域的预测残差强度分布;计算每帧与其相邻帧剩下的关键点对应分布的杰森香农散度,构建输入视频的特征序列;
步骤5:将特征序列划分为不重叠的子序列,将子序列输入完成训练的多层感知机分类器,得到输出分数;将输入视频所有子序列输出分数的平均值作为输入视频的检测分数;如果检测分数大于阈值则为HEVC双压缩视频,反之为单次压缩视频;
所述步骤1包括如下步骤:
步骤1.1:将输入视频进行解压缩,并将每张解压帧转换为灰度图,构成帧序列{F1,F2,...,Ft,...,FT},其中Ft表示第t个解压帧的灰度图,T表示输入视频的总帧数;
步骤1.2:对Ft,利用关键点提取算法分别获得Ft与其相邻帧Ft+1中的关键点,构成集合Dt和Dt+1;关键点集合中每个关键点对应一个特征向量;Ft与其相邻帧Ft+1中关键点的特征向量构成集合和其中表示第t个解压帧中第j个关键点对应的特征向量;Nt表示第t个解压帧中关键点的数量;将欧式距离作为距离度量方式,集合Vt中每个特征向量与Vt+1中所有特征向量依次计算距离,选择其中距离最小的特征向量;若上述最小距离小于阈值,则认为两个关键点匹配,将Ft与Ft+1对应匹配的关键点组成集合,记为和关键点的提取和特征描述采用SIFT算法;
所述步骤2包括如下步骤:
步骤2.1:计算Ft及其相邻帧Ft+1差值的绝对值,即绝对差值Et=|Ft-Ft+1|;上述差值操作以像素为单位进行,并对绝对差值进行归一化处理
步骤2.2:依次对Ft中关键点集合的每个关键点计算时空复杂性度量,以第j个关键点为例,其坐标记为(xj,yj),以(xj,yj)为中心、b为中心至边距离选取第一正方形区域Bj,计算第一正方形区域Bj内归一化绝对差值的平均值,即时域复杂度,如公式(1)所示:
计算第一正方形区域Bj中Ft的图像熵,即空域复杂度,如公式(2)所示:
其中pg表示第一正方形区域Bj中Ft取值为g的像素出现的频率;
所述步骤3包括如下步骤:
步骤3.1:将Ft中集合的关键点分别按照时域复杂度和空域复杂度的大小进行升序排列,集合中第j个关键点升序排列后的序号分别记为和第j个关键点的时空复杂性度量因子为
步骤3.2:根据时空复杂性度量因子,剔除集合中具有空间聚合关系的关键点,经过剔除处理后的关键点集合将用于后续的特征序列提取过程,具体地:
步骤3.2.1:定义空集选取中时空复杂性度量因子最大的关键点,加入集合
步骤3.2.2:在差集中,选取时空复杂性度量因子最大的关键点,记为比较关键点与集合中所有关键点空间位置的欧氏距离,取其中的最小值dmin;如果dmin大于预设阈值Td,则将关键点加入到集合中;
步骤3.2.3:重复步骤3.2.2直到遍历集合中的所有元素,最终形成集合将Ft+1的关键点集合中与集合中关键点对应匹配的关键点组成集合
所述步骤4包括如下步骤:
步骤4.1:从视频文件中分别提取Ft和Ft+1对应的预测残差;
步骤4.2:依次计算Ft中属于集合的关键点对应的局部区域的预测残差强度分布具体地,以关键点为例,选取以为中心,中心至边距离为b的第二正方形区域,在该第二正方形区域内进行如下操作:设置k∈{0,1,...,255},其中表示关键点局部正方形区域内预测残差强度绝对值为k的像素点数量,如果k≥Tk则进行截断统计,其中Tk为预设的截断阈值;
依次计算Ft+1中属于集合的关键点对应的局部区域的预测残差强度分布具体地,以关键点为例,选取以为中心,中心至边距离为b的第三正方形区域;在该第三正方形区域内进行如下操作:设置k∈{0,1,...,255},其中表示关键点局部正方形区域内预测残差强度绝对值为k的像素点数量;如果k≥Tk则进行截断统计,
步骤4.3:计算集合和集合匹配关键点对应的预测残差强度分布之间的杰森香农散度,具体地,以Ft的第i个关键点和其在Ft+1中对应的关键点为例,预测残差强度分布和之间的杰森香农散度按照公式(3)及(4)计算:
其中p(x)和q(x)分别表示两个离散分布,x表示离散分布的取值;
步骤4.4:计算集合和集合所有匹配关键点之间杰森香农散度的平均值,作为Ft的双压缩痕迹度量,构建输入视频的特征序列{M(1),M(2),...,M(t),...,M(T)},其中表示集合和集合中第i对匹配关键点之间的杰森香农散度值,|·|表示集合中元素的个数,t∈{1,2,...,T};
所述步骤5包括如下步骤:
步骤5.1:将输入视频的特征序列{M(1),M(2),...,M(t),...,M(T)}划分为不重叠且长度为L的子序列其中v表示子序列的编号,v∈{1,2,...,NL},NL为输入视频可划分的子序列总数,即为向下取整操作;若输入视频长度小于L则该视频由于长度过短无法提供检测;T表示输入视频的总帧数;
步骤5.2:构造多层感知机网络作为分类器,该网络由一个输入层,一个隐藏层和一个输出层级联构成;相邻两层之间节点两两连接,输入层的节点数量与特征子序列的长度相同,输出层的节点数量是2;输入层和隐藏层的非线性激活函数采用tanh函数,其形式为其中z表示输入值,输出层之后采用softmax函数,其形式为其中i'∈{1,2},[z1,z2]表示输出层的输出向量;softmax函数用于将输出层输出的二维向量归一化到[0,1]之间,分别作为输入样本属于包含异常帧的视频子序列和不包含异常帧的视频子序列的概率;异常帧是指第一次采用帧内编码而第二次采用帧间编码的重压缩帧;最后,softmax函数输出的概率向量与样本标签的交叉熵作为损失函数,指导网络训练;
步骤5.3:将每个特征子序列lv作为分类特征输入完成训练的多层感知机网络,并将该输入样本属于包含异常帧的特征子序列的概率sv作为输出分数;
步骤5.4:重复步骤5.3,直到所有特征子序列的输出分数计算完毕,将所有特征子序列输出分数的平均值,即作为输入视频最终的检测分数;将检测分数与预设阈值Ts进行比较,若检测分数大于Ts则输入视频经过HEVC双压缩;反之,则为单次压缩视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910201618.7/1.html,转载请声明来源钻瓜专利网。