[发明专利]一种基于ENF通用背景模型的数字音频篡改盲检测方法有效
申请号: | 201810572178.1 | 申请日: | 2018-06-06 |
公开(公告)号: | CN108766465B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 王志锋;王静;左明章;叶俊民;闵秋莎;田元;夏丹;姚璜;罗恒;陈迪 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/27 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 enf 通用 背景 模型 数字音频 篡改 检测 方法 | ||
1.一种基于ENF通用背景模型的数字音频篡改盲检测方法,其特征在于,所述基于ENF通用背景模型的数字音频篡改盲检测方法为:
首先对大量的原始语音信号进行信号预处理,得到信号中包含的电网频率ENF成分;接着对ENF信号进行特征提取,提取ENF信号的相位谱波动特征,相位谱和频率谱拟合参数特征,进行通用背景模型训练;
通过通用背景模型描述原始信号中与篡改特性无关的普通水平特征分布,并使用少量的篡改数据库中的原始语音信号自适应出未篡改的语音信号特征模型;
将训练数据作同样的特征提取,并与已训练出的UBM模型进行匹配;经过评分系统的处理,量化模型匹配度为分数标量;
在监督学习条件下,绘制出ROC曲线,找到EER;根据EER的值计算正反例的分界值;
所述基于ENF通用背景模型的数字音频篡改盲检测方法具体包括:
步骤1:对大量原始语音信号进行特征提取;
步骤2:ENF通用背景模型建立;
步骤3:使用目标数据库中的ENF信号特征对ENF-UBM模型进行自适应,得到目标数据库原始信号的ENF模型;
步骤4:对训练数据进行评分系统处理;
步骤4具体包括:
i)经过训练过程产生的GMM模型为λ,对于观察序列X={x1,x2,…,xM},由GMM模型产生X的概率记为p(X|λ),p(X|λ)越大,X属于λ分布的可能性越大;
ii)观察序列X是否属于模型λ的可能性评分函数Sλ(X),为:
Sλ(X)=logp(X|λ)
在评分函数Sλ(X)的基础上将特征向量映射为标量评分值;
步骤5:绘制ROC曲线,找到EER,计算正反例的分界值;
步骤6:数字音频盲篡改检测模型测试。
2.如权利要求1所述的基于ENF通用背景模型的数字音频篡改盲检测方法,其特征在于,步骤1具体包括以下步骤:
步骤1.1:对每个原始信号x[n]进行预处理,包括下采样、去直流分量,经过带通滤波得到信号中的ENF成分xENFC[n];
步骤1.2:对xENFC[n]进行相位谱和频率谱估计,提取相位谱波动特征F,分别对相位谱和频率谱进行曲线拟合,提取相位谱拟合特征和瞬时频率谱拟合特征进行特征融合得到特征向量;
步骤2具体包括以下步骤:
步骤A1:建立ENF-UBM模型;
步骤A2:利用期望最大化EM算法迭代出ENF-UBM模型的参数。
3.如权利要求2所述的基于ENF通用背景模型的数字音频篡改盲检测方法,其特征在于,步骤A1中,ENF-UBM模型为高斯混合模型记为λ;用X表示一条语音的特征向量,由M个不同的高斯分布按照不同的权重ω组合描述,混合高斯模型表示为:
其中,pi(X)是第i个D维随机变量的联合高斯概率密度分布;
步骤A2中,已知样本特征集和分布模型,对样本属于哪一个高斯分布和每个高斯分布的参数进行估计;
EM算法包括:第一步,每一个特征向量Xi都有一个与特征向量Xi对应的隐藏变量zi,令p(xi|zi)最大;
第二步,对似然函数最大化以获得新的模型参数,通过不断迭代获得更加准确的ENF-UBM模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810572178.1/1.html,转载请声明来源钻瓜专利网。