[发明专利]一种音视频匹配零水印生成方法及音视频防篡改检测方法有效

申请号：	202010975238.1	申请日：	2020-09-16
公开（公告）号：	CN112153482B	公开（公告）日：	2022-02-22
发明（设计）人：	范迪;刘晓欣;孙文雪;吕常智;高尚;董爽;张潇	申请（专利权）人：	山东科技大学
主分类号：	H04N21/8358	分类号：	H04N21/8358;H04N21/845;H04N21/439;H04N21/44;G10L19/018
代理公司：	青岛锦佳专利代理事务所(普通合伙) 37283	代理人：	朱玉建
地址：	266590 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频匹配水印生成方法篡改检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音视频匹配零水印生成方法，其特征在于，包括如下步骤：

a.对音视频流进行解码，以时间t1为单位进行分段，得到音视频段合集；

其中，对于音视频段合集中每个视频段对应的音频段按照下述步骤b进行处理；同时，对于音视频段合集中的每个视频段，按照下述步骤c进行处理；

b.生成加密后的声音水印，具体过程如下：

取音频段一个声道的音频，即单声道音频段，进行特征提取；

b.1.首先判断音频段的类型；

若判定为无声段，则转到步骤b.2，若判定为有声段，则转到步骤b.3；

b.2.采用固定的版权水印，作为声音水印，并转到步骤b.4；

b.3.利用音频段非静音部分低频小波系数的一阶矩和二阶矩为特征，进行编码得到声音二值特征矩阵，将得到的声音二值特征矩阵作为声音水印，并转到步骤b.4；

b.4.对得到的声音水印进行加密，得到加密后的声音水印；

c.对视频段中的关键帧图像进行选取，然后基于关键帧图像构造视频特征矩阵；

d.将步骤b得到的加密后的声音水印与步骤c得到的视频特征矩阵进行异或操作，得到零水印；其中，该零水印中携带了相匹配的音频和视频的特征信息。

2.根据权利要求1所述的音视频匹配零水印生成方法，其特征在于，

所述步骤b.1中，当前音频段的类型判断过程为：

b.1.1.首先对音频段以时间t2为单位进行分帧操作得到音频帧集合；

b.1.2.计算音频帧集合中每个音频帧的短时平均过零率以及短时能量；

其中，每个音频帧的短时平均过零率，是指一帧语音时域信号穿过时间轴的次数；每个音频帧的短时能量，是指一帧语音信号的能量；

b.1.3.根据音频帧的短时平均过零率以及短时能量，判断此帧是否为静音帧；

b.1.4.根据音频帧集合中静音帧的数量占音频帧总数的比例是否大于设定音频段类型判断阈值，判断当前音频段的类型；

经过判断若大于设定音频段类型判断阈值，则判定为无声段，否则判定为有声段。

3.根据权利要求2所述的音视频匹配零水印生成方法，其特征在于，

所述步骤b.1.2中短时平均过零率以及短时能量的计算公式分别如下：

定义音频段x(j)分帧后得到音频帧y_i(j)，l为帧长，i为帧号，f_n为分帧后的总帧数；

则音频帧y_i(j)的短时平均过零率ZCC(i)的计算公式为：

式中，sgn[·]是符号函数，即

则第i帧的短时能量E(i)的计算公式为：

4.根据权利要求2所述的音视频匹配零水印生成方法，其特征在于，

所述步骤b.1.3中静音帧的判断过程为：

设定短时平均过零率和短时能量的阈值分别为Th₁、Th₂；若音频帧的过零率小于阈值Th₁，且其短时能量大于阈值Th₂，则判定此音频帧为非静音帧；否则，判定为静音帧。

5.根据权利要求2所述的音视频匹配零水印生成方法，其特征在于，

所述步骤b.3的具体过程为：

去除音频段在步骤b.1中被判定为静音帧的音频帧，保留音频段中的非静音部分，进行特征提取；对非静音部分进行二级小波变换得到低频小波系数；

以低频小波系数的一阶矩和二阶矩为特征进行K-means编码，得到声音二值特征矩阵；

将得到的声音二值特征矩阵作为声音水印，并转到步骤b.4。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东科技大学，未经山东科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010975238.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载