[发明专利]面向数字音频删除和插入篡改操作自动检测方法及系统在审
申请号: | 202111315681.7 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114048770A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 曾春艳;孔帅;王志锋;冯世雄;余琰;夏诗言 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 张晓博 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 数字音频 删除 插入 篡改 操作 自动检测 方法 系统 | ||
1.一种面向数字音频删除和插入篡改操作自动检测方法,其特征在于,所述面向数字音频删除和插入篡改操作自动检测方法包括:
利用训练好的电网频率的通用背景模型,提取每个数字音频信号的电网频率频谱特征超矢量;
将所提取的电网频率频谱特征超矢量输入由注意力机制和残差网络构成的深度表示学习网络进行浅层特征的学习;
将训练好的浅层特征输入到分类网络中,判断是否经过删除或插入的篡改。
2.如权利要求1所述面向数字音频删除和插入篡改操作自动检测方法,其特征在于,所述面向数字音频删除和插入篡改操作自动检测方法包括以下步骤:
步骤一,利用带通滤波器对原始数字音频信号进行预处理,提取待测信号的电网频率成分;提取相位特征和拟合特征参数,并构建电网频率的通用背景模型;
步骤二,训练数据集数字音频信号对所得到的通用背景模型通过自适应更新电网频率的通用背景模型参数,根据目标数据库构造数字音频信号的电网频率频谱特征超矢量的特征矩阵;
步骤三,将得到的电网频率频谱特征超矢量输入到深度神经网络进行浅层特征的表示学习,得到浅层特征即电网频率频谱特征超矢量;
步骤四,将训练好的浅层特征输入预先构建的篡改检测分类网络,通过sigmod函数区分原始语音和篡改语音,得到篡改检测结果。
3.如权利要求2所述面向数字音频删除和插入篡改操作自动检测方法,其特征在于,步骤一中,所述利用带通滤波器对原始数字音频信号进行预处理,提取待测信号的电网频率成分,提取相位特征和拟合特征参数包括:
利用10000阶的线性相位FIR滤波器对原始数字音频信号f[n]进行带通滤波,得到待测信号中的电网频率成分FENFC[n];
基于DFT0和DFT1变换得到相位波动特征F1和F2,基于Hilbert变换得到瞬时频率特征F3;
使用Sum of Sines和Gaussian表达式分别进行拟合相位曲线和频率曲线,将相位特征和拟合特征参数进行组合得到特征向量。
4.如权利要求2所述面向数字音频删除和插入篡改操作自动检测方法,其特征在于,所述构建电网频率的通用背景模型包括:
(1)确定高斯混合模型:
其中,f表示一个由相位特征和拟合特征参数组成的N维特征向量f={f1,f2,…,fN};φj,j=1,…L表示混合权重;σj表示协方差矩阵;μj表示均值向量;
(2)采用EM算法进行混合高斯模型的参数估计:
(2.1)确定合适的θ和z极大化对数似然函数:
其中,x=(x1,x2,x3,…,xm)表示语音特征向量,m表示相互独立的语音特征向量的数量;λ表示数字音频信号模型,θ表示已知模型参数,zi,zi∈(z1,z2,z3,…,zi)表示与特征向量xi对应的隐藏变量,令p(xi,zi|θ)最大;
(2.2)计算θ和z的值:基于Q(z)为已知样本和模型参数下的隐变量z的分布,确定在固定参数θ后Qi(zi)的选择问题,建立了L(θ,Z)的下界即通过调整θ最大化所述下界,对似然函数最大化获得新的模型参数,返回代入(2.1)中,通过不断迭代获得更加准确的GMM参数,得到一个好的电网频率的通用背景模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111315681.7/1.html,转载请声明来源钻瓜专利网。