[发明专利]一种基于卷积神经网络的翻录语音检测方法在审
申请号: | 201711323563.4 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108198561A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 王让定;李璨;严迪群;林朗 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L25/18;G10L17/04;G10L17/00;G10L17/02 |
代理公司: | 宁波奥圣专利代理事务所(普通合伙) 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 原始语音 负样本 正样本 训练模型 语音检测 训练集 语音库 构建 语音 分类结果 文本限制 测试集 准确率 偷录 样本 测试 检测 | ||
本发明公开了一种基于卷积神经网络的翻录语音检测方法,其先构建原始语音库和翻录语音库;然后提取原始语音库中的每个原始语音的语谱图作为正样本,提取翻录语音库中的每个翻录语音的语谱图作为负样本,选择一部分正样本和负样本构成训练集,剩余部分正样本和负样本构成测试集;接着根据训练集和卷积神经网络框架,构建卷积神经网络框架训练模型;再将测试集中的每个样本作为输入,输入到卷积神经网络框架训练模型中,得到分类结果;优点是其能够在不受文本限制的情况下,针对多种偷录设备的翻录语音均具有较高的检测准确率。
技术领域
本发明涉及一种语音检测技术,尤其是涉及一种基于卷积神经网络的翻录语音检测方法。
背景技术
随着互联网的不断发展和便携式智能终端的快速普及,人们能够更加方便快捷地借助各种数字媒体(如图像、音频、视频等)传递信息。与此同时,随着回放设备、高保真录音设备的普及,合法用户的密语在请求进入识别系统时极易被攻击者偷录成功。翻录语音经高保真录音设备偷录、回放设备回放,与原始语音具有较高的相似度,一些说话人认证系统也无法辨别,危害了合法用户的权益;而且翻录语音因偷录设备体积小、易偷录、成功率高等优势,已成为攻击语音认证系统中最易实施的方法。因此,对翻录语音检测已受到业内的广泛重视。
近年来,对翻录语音检测的研究取得了一定的成果。
第一类,研究者根据语音产生的随机性,对比了原始语音与翻录语音的Peak map(Shang W,Stevenson M.A playback attack detector for speaker verificationsystems[C]//In ternational Symposium on Communications,Control and SignalProcessing.IEEE,2008:1144-1149.尚威,史蒂芬森.一种用于说话人认证系统的回放攻击检测算法[C]//通信、控制和信号处理国际会议.IEEE,2008:1144-1149。)的不同,提出了一种基于Peak map相似度的录音回放检测算法,若Peak map相似度大于设定的阈值,则判定为翻录语音;反之,判定为原始语音。在此基础上,有人对该算法进行了改进,在Peak map特性中加入了各语音频率点的位置关系,依据待认证语音与原始语音在该特征上的相似度来判断待认证语音是否为合法语音。以上方法只能针对文本相关的识别系统,无法适用于文本无关的翻录语音检测,具有较大的局限性。
第二类,根据信道模式特征,利用翻录语音信道与原始语音信道之间的差异,提出了一种基于静音段的MFCC(Mel-frequency cepstral coefficients,梅尔频率倒谱系数)的翻录语音检测算法,该算法用原始语音数据的静音段对原始语音信道建模,检测待测语音与训练语音的信道是否相同,从而判断是否为翻录攻击。另一种算法根据原始语音与翻录语音产生的信道不同,提取信道模式噪声,并利用SVM(Support Vector Machine,支持向量机)得到了很好的分类结果。第三种算法根据高保真录音设备信道对语音编码过程的影响,提出了一种基于长窗比例因子的翻录语音检测算法。以上方法只能检测单一设备录制的语音,未对多种不同的偷录设备及回放设备进行分析与研究,其中第二种算法提取的信道模式噪声也不准确。
目前,针对翻录语音检测方面大部分工作都是针对一种偷录设备及回放设备的翻录语音,对多种录音设备的翻录语音检测研究的关注较少。而在现实生活中,各种高保真录音设备随处可见,如录音笔及各种智能手机,这类录音设备携带便利且不易察觉,且获得的翻录语音与原始语音相似性较高,这类录音设备是目前较为主流的偷录设备。因此,研究针对多种录音设备的翻录语音检测是非常有必要的。
发明内容
本发明所要解决的技术问题是提供一种基于卷积神经网络的翻录语音检测方法,其在不受文本限制的情况下,针对多种偷录设备的翻录语音均具有较高的检测准确率。
本发明解决上述技术问题所采用的技术方案为:一种基于卷积神经网络的翻录语音检测方法,其特征在于包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711323563.4/2.html,转载请声明来源钻瓜专利网。