[发明专利]一种基于信道模式噪声的录音回放攻击检测方法和系统无效

申请号：	201110330598.7	申请日：	2011-10-26
公开（公告）号：	CN102436810A	公开（公告）日：	2012-05-02
发明（设计）人：	贺前华;王志锋;罗海宇;陈芬	申请（专利权）人：	华南理工大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/08
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于信道模式噪声录音回放攻击检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及智能语音信号处理、模式识别与人工智能技术领域，特别是涉及一种基于信道模式噪声的说话人识别系统中录音回放攻击检测方法和系统。

背景技术

随着说话人识别技术的不断发展，说话人识别系统得到了非常广泛的应用，例如：司法取证、电子商务、金融系统等。与此同时，说话人识别系统所面临的一些安全问题制约了其发展和应用。说话人识别系统面临的两种常见攻击是说话人仿冒攻击和录音回放攻击。说话人仿冒攻击是指攻击者通过模仿说话人识别系统中用户的声音对系统进行攻击。在双胞胎语音库上的说话人识别实验表明现有的说话人识别技术能够区分具有类似声学特性的双胞胎语音，因此实施说话人仿冒攻击需要有非常好的模仿技巧，使得攻击者的语音能够和系统用户的语音达到高度相似，这使得仿冒攻击的可实施性不高。录音回放攻击是指攻击者事先用高保真录音设备偷录说话人识别系统中用户的语音，然后通过高保真功放在系统输入端回放，以此对说话人识别系统实施攻击。对于文本相关的说话人识别系统，可以通过偷录用户进入系统时的语音或偷录大量用户语音通过音节拼接的方式实施回放攻击。对于文本无关的系统只需获得用户部分语音即可实施回放攻击。与仿冒语音相比，录音回放语音是真实来自于用户本人，它对说话人识别系统造成的威胁更大。另一方面，现在性能好的高保真录音及回放设备不断涌现，价格也越来越便宜，并且体积也越来越小，便于携带不易被发现，这也让录音回放攻击变得越来越容易。

防止录音回放攻击的一种策略是通过系统随机挑选语句让用户跟读，在进行说话人识别的同时还要判断用户是否按要求来跟读。这种方法的实施需要事先准备丰富的语音库，并且要求用户按照语音内容跟读，当用户按照自己的发音习惯跟读时，将有可能不能通过说话人识别系统，这种不太友好的交互性方式不容易被用户所接受。而且这种方法会牺牲掉说话人识别系统对于特定用户特定文本的安全保护性，会产生其它安全问题。在实际的应用中，这种方法只能用于文本相关的说话人识别系统，在做说话人识别的同时还要进行语音的文本识别，这也降低了说话人识别系统的总体效率。

还有采用句子相似度比较的方法，用户每次输入的口令虽然文本相同，但是两次不可能采集到同样的样本，因此如果输入的句子和存储的句子相似度高过一定的范围就可以认定为录音回放攻击。这种方法存在明显缺陷：一、该算法只能够应用于文本相关的说话人识别系统进行录音回放攻击检测；二、用户每次进入系统的样本都要存下来，需要大量存储空间；三、每次用户进入系统的样本都要和所有存储样本进行相似性比较，计算量非常大；四、如果所录回放语音并不是在用户进入系统时录制，例如私下录制或者是通过音节拼接得到，那么这个方法就无效；五、这种方法对阈值设定的依赖性很强，说话人识别本身就是进行相似度比较，相似度高的判断为同一个说话人，因此回防攻击和说话人自身识别的相似度阈值的界限很难确定。

发明内容

本发明的目的在于克服现有技术的缺陷和不足，提供一种基于信道模式噪声的录音回放攻击检测方法，用于说话人识别系统中可提高录音回放攻击检测的成功率。

本发明的另一目的还在于提供实现上述方法的系统。

本发明的目的通过下述技术方案实现：

一种基于信道模式噪声的录音回放攻击检测方法，其特征在于，所述录音回放攻击检测方法包括以下步骤：

(1)输入待识别语音信号；

(2)对语音信号进行预处理；

(3)提取预处理后语音信号中的信道模式噪声；

(4)提取基于信道模式噪声的长时统计特征；

(5)根据信道噪声分类判决模型对长时统计特征进行分类，得到录音回放攻击检测的判决结果。

所述步骤(2)预处理包括预加重、分帧和加窗。

所述步骤(3)包括以下步骤：