[发明专利]一种基于信道模式噪声的录音回放攻击检测方法和系统无效
申请号: | 201110330598.7 | 申请日: | 2011-10-26 |
公开(公告)号: | CN102436810A | 公开(公告)日: | 2012-05-02 |
发明(设计)人: | 贺前华;王志锋;罗海宇;陈芬 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信道 模式 噪声 录音 回放 攻击 检测 方法 系统 | ||
技术领域
本发明涉及智能语音信号处理、模式识别与人工智能技术领域,特别是涉及一种基于信道模式噪声的说话人识别系统中录音回放攻击检测方法和系统。
背景技术
随着说话人识别技术的不断发展,说话人识别系统得到了非常广泛的应用,例如:司法取证、电子商务、金融系统等。与此同时,说话人识别系统所面临的一些安全问题制约了其发展和应用。说话人识别系统面临的两种常见攻击是说话人仿冒攻击和录音回放攻击。说话人仿冒攻击是指攻击者通过模仿说话人识别系统中用户的声音对系统进行攻击。在双胞胎语音库上的说话人识别实验表明现有的说话人识别技术能够区分具有类似声学特性的双胞胎语音,因此实施说话人仿冒攻击需要有非常好的模仿技巧,使得攻击者的语音能够和系统用户的语音达到高度相似,这使得仿冒攻击的可实施性不高。录音回放攻击是指攻击者事先用高保真录音设备偷录说话人识别系统中用户的语音,然后通过高保真功放在系统输入端回放,以此对说话人识别系统实施攻击。对于文本相关的说话人识别系统,可以通过偷录用户进入系统时的语音或偷录大量用户语音通过音节拼接的方式实施回放攻击。对于文本无关的系统只需获得用户部分语音即可实施回放攻击。与仿冒语音相比,录音回放语音是真实来自于用户本人,它对说话人识别系统造成的威胁更大。另一方面,现在性能好的高保真录音及回放设备不断涌现,价格也越来越便宜,并且体积也越来越小,便于携带不易被发现,这也让录音回放攻击变得越来越容易。
防止录音回放攻击的一种策略是通过系统随机挑选语句让用户跟读,在进行说话人识别的同时还要判断用户是否按要求来跟读。这种方法的实施需要事先准备丰富的语音库,并且要求用户按照语音内容跟读,当用户按照自己的发音习惯跟读时,将有可能不能通过说话人识别系统,这种不太友好的交互性方式不容易被用户所接受。而且这种方法会牺牲掉说话人识别系统对于特定用户特定文本的安全保护性,会产生其它安全问题。在实际的应用中,这种方法只能用于文本相关的说话人识别系统,在做说话人识别的同时还要进行语音的文本识别,这也降低了说话人识别系统的总体效率。
还有采用句子相似度比较的方法,用户每次输入的口令虽然文本相同,但是两次不可能采集到同样的样本,因此如果输入的句子和存储的句子相似度高过一定的范围就可以认定为录音回放攻击。这种方法存在明显缺陷:一、该算法只能够应用于文本相关的说话人识别系统进行录音回放攻击检测;二、用户每次进入系统的样本都要存下来,需要大量存储空间;三、每次用户进入系统的样本都要和所有存储样本进行相似性比较,计算量非常大;四、如果所录回放语音并不是在用户进入系统时录制,例如私下录制或者是通过音节拼接得到,那么这个方法就无效;五、这种方法对阈值设定的依赖性很强,说话人识别本身就是进行相似度比较,相似度高的判断为同一个说话人,因此回防攻击和说话人自身识别的相似度阈值的界限很难确定。
发明内容
本发明的目的在于克服现有技术的缺陷和不足,提供一种基于信道模式噪声的录音回放攻击检测方法,用于说话人识别系统中可提高录音回放攻击检测的成功率。
本发明的另一目的还在于提供实现上述方法的系统。
本发明的目的通过下述技术方案实现:
一种基于信道模式噪声的录音回放攻击检测方法,其特征在于,所述录音回放攻击检测方法包括以下步骤:
(1)输入待识别语音信号;
(2)对语音信号进行预处理;
(3)提取预处理后语音信号中的信道模式噪声;
(4)提取基于信道模式噪声的长时统计特征;
(5)根据信道噪声分类判决模型对长时统计特征进行分类,得到录音回放攻击检测的判决结果。
所述步骤(2)预处理包括预加重、分帧和加窗。
所述步骤(3)包括以下步骤:
(31)将预处理后的语音信号进行去噪滤波处理;
(32)对去噪滤波处理前、后的信号分别进行统计帧分析;
(33)将统计帧分析后的两路信号提取对数功率谱,并作减法运算,提取出输入语音信号的信道模式噪声。
所述统计帧是对语音信号的短时帧做离散傅里叶变换后,取其中相同频率成分的平均值。
所述步骤(4)包括以下步骤:
(41)提取信道模式噪声的0~5阶Legendre多项式展开系数;
(42)提取信道模式噪声的六个统计特征;
(43)将上述步骤获得的数值合并成一组12维的长时统计特征矢量,作为录音回放攻击检测的特征矢量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110330598.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:USB视频断点续播方法和装置
- 下一篇:POS机的外壳及POS机