[发明专利]一种基于RNN的多种伪造操作语音检测方法在审
申请号: | 202010382185.2 | 申请日: | 2020-05-08 |
公开(公告)号: | CN111564163A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 严迪群;乌婷婷;王让定 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 袁忠卫;林辉 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rnn 多种 伪造 操作 语音 检测 方法 | ||
本发明公开了一种基于RNN的多种伪造操作语音检测方法,包括如下步骤:1)获取原始语音样本,对所述原始语音样本进行M种伪造处理,得到M个伪造操作后的语音和1个未经处理的原始语音,对上述语音进行特征提取,得到训练语音样本的LFCC矩阵,送入RNN分类器网络中进行训练,得到一个多分类的训练模型;2)得到一段测试语音,对该测试语音进行特征提取,得到测试语音数据的LFCC矩阵,送入由步骤1)训练好的RNN分类器中进行分类,每一个测试语音得到一个输出概率,合并所有输出概率作为最后的预测结果:如果预测结果是原始语音,则测试语音被识别为原始语音;如果预测结果是经过某一伪造操作的语音,则测试语音被识别为进行相应伪造操作的伪造语音。
技术领域
本发明涉及语音检测方法,尤其是一种基于RNN的多种伪造操作语音检测方法。
背景技术
随着语音编辑软件功能的不断增强,非专业人士也可以很容易对语音内容进行修改。如果有不法分子恶意地对语音进行伪造修改,甚至将修改后的语音用于新闻报道、司法取证以及科学研究等领域,这将会带来巨大的威胁,甚至会对社会稳定造成不可估计的影响。数字语音取证方法是对伪造操作的检测,对于鉴别音频材料的原始性与真实性有至关重要的作用,是当前多媒体取证领域的重点研究课题。
现有的数字语音取证检测技术大部分都是检测到单一的伪造操作,即取证人员假设待检测语音会经过某种特定的伪造操作。Mengyu Qiao等人提出了一种基于量化的MDCT系数及其导数的统计特征的检测算法,检测上转换和下转换的MP3音频文件,通过重新压缩和校准音频来生成参考音频信号,然后用支持向量机进行分类,实验结果表明该方法有效地检测了MP3双重压缩并可以检测数字取证的音频处理历史。如王丽华等人提出了一种基于卷积神经网络的变调语音处理历史检测,通过对三种语音库应用四种不同的变调软件进行变调,并使用CNN对语音的变调因子进行语音库内和库间以及变调方法之间的检测,其检测率达到了90%以上。
现有的数字语音取证检测技术能够检测到单一的伪造操作,且检测率可以达到很高的水平。但在实际应用中,取证者常常无法预测伪造的具体操作,使用某一特定操作分类器进行检测可能会出现误判。
目前,大多数现有适用多种伪造操作的数字取证工作都集中在数字图像领域上,针对数字语音取证的研究仍较少。在数字语音领域,骆伟祺团队设计了一个卷积神经网络模型,可以用于检测两个不同音频编辑软件中默认设置的音频处理操作,并提供了较好的结果,该方法可以显着优于现有的基于手工特征的取证方法。然而,该实验虽然开创性地对语音的多种伪造操作检测进行了研究,却存在着一些不容忽视的问题,如计算的复杂度过高、所针对伪造操作的应用场景过于理想等。
发明内容
本发明所要解决的技术问题是针对上述现有技术存在的不足,提供一种基于RNN的多种伪造操作语音检测方法,能够提高检测准确率。
本发明解决上述技术问题所采用的技术方案为:一种基于RNN的多种伪造操作语音检测方法,其特征在于:包括如下步骤:
1)训练网络:获取原始语音样本,对所述原始语音样本进行M种伪造处理,得到M个伪造操作后的语音和1个未经处理的原始语音,对上述M个伪造后的语音和1个原始语音进行特征提取,得到训练语音样本的LFCC矩阵,送入RNN分类器网络中进行训练,得到一个多分类的训练模型;
2)语音识别:得到一段测试语音,对该测试语音进行特征提取,得到测试语音数据的LFCC矩阵,送入由步骤1)训练好的RNN分类器中进行分类,每一个测试语音得到一个输出概率,合并所有输出概率作为最后的预测结果:如果预测结果是原始语音,则测试语音被识别为原始语音;如果预测结果是经过某一伪造操作的语音,则测试语音被识别为进行相应伪造操作的伪造语音。
优选的,在步骤1)和2)中,得到LFCC矩阵的步骤为:
1)FFT:首先先对语音进行预处理,计算每一个语音帧经过FFT后的频谱能量E(i,k):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010382185.2/2.html,转载请声明来源钻瓜专利网。