[发明专利]利用语音振幅信息和多种相位检测语音欺诈重放攻击方法在审
申请号: | 201910199508.1 | 申请日: | 2019-03-15 |
公开(公告)号: | CN109841219A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 李东播;关昊天 | 申请(专利权)人: | 慧言科技(天津)有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/06;G10L25/51 |
代理公司: | 北京栈桥知识产权代理事务所(普通合伙) 11670 | 代理人: | 潘卫锋 |
地址: | 300384 天津市西青区天津华苑产业*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 相位检测 相位信息 振幅信息 重放攻击 欺诈 判别结果 欺诈检测 相关信息 相位特征 信息融合 真实语音 振幅特征 自动判断 判别式 互补性 融合 分析 | ||
1.一种利用语音振幅信息和多种相位检测语音欺诈重放攻击方法,其特征在于,主要包括以下步骤:
S1:振幅特征以及相位特征提取:
所述振幅特征为CQCC特征,所述相位特征为Mel-RP特征以及MPVT特征;其中,振幅特征的提取是通过将使用恒Q变换将频率仓的几何空间转化为线性空间;相位特征的提取主要通过了预处理方法得到相位谱,然后在此基础上进行处理;
S2:进行各特征模型训练;
S3:分数级别特征融合:如步骤S2进行模型训练,并且使用以下模型来获得真实语音和欺骗语音之间的对数似然之间的差异来进行计算分数;
S=log(P(X|θg))-log(P(X|θs))
其中,P表示的是似然函数,X表示的是特征向量序列,θg和θs分别为真实语音与欺诈语音的模型的参数;
使用分数级别特征融合的方法,在得分水平上组合两个系统之间的信息,获得信息增益并改善组合系统的最终结果;对于两个得分组合,使用线性组合的方法;对于两个系统分数级别的信息融合,使用如下方式进行组合:
Lcomp=(1-α)L1+αL2
针对三个独立模型进行分数级别的信息融合,使用以下公式进行信息融合:
Lcomp=αL1+βL2+(1-α-β)L3
其中,L1和L2分别表示两个独立的模型的分数,和表示的是两个独立模型分数的均值。
2.根据权利要求1所述的一种利用语音振幅信息和多种相位检测语音欺诈重放攻击方法,其特征在于,所述步骤S1中的CQCC特征提取具体为:通过使用恒Q变换,将频率仓的几何空间转换为线性空间,然后进行重采样归一化以及DCT方法。
3.根据权利要求1所述的一种利用语音振幅信息和多种相位检测语音欺诈重放攻击方法,其特征在于,所述步骤S1中的MPVT特征提取具体为:将相位信息分为两个部分:最小相位(MinPh(ω))以及全通相位(AllPh(ω));
在语音信号中,存在着以下的关系:
X(ω)=XMinPh(ω)XAllPh(ω)
|X(ω)|=|XMinPh(ω)|
arg[X(ω)]=arg[XMinPh(ω)]+arg[XAllPh(ω)]
其中,|X(ω)|和arg[X(ω)]分别为短时振幅和非卷绕的相位谱信息;基于复数倒谱对于X_MinPh信号的因果关系,希尔伯特变换提供了幅度和相位之间的映射:
|X(ω)|=|XMinPh(ω)|成立后,使用|X|代替公式中的|XMinPh(ω)|计算最小相位;声道信息(XVT(ω))与声源激励信息(XExc(ω))在最小相位分量中表示:
|X(ω)|=|XVT(ω)||XExc(ω)|=|XMinPh(ω)|
在相位域中使用源滤波模型进行计算arg[XVT(ω)]和arg[XExc(ω)];并使用群延迟的方法来进行解决相位卷绕,群延迟函数定位为以下方式:
其中,arg[.]和Im{.}分别表示为非卷绕相位及其虚部部分,w表示的是角频率。
4.根据权利要求3所述的一种利用语音振幅信息和多种相位检测语音欺诈重放攻击方法,其特征在于,所述MPVT特征中还使用滤波器组来对所提特征进行滤波处理,获得相应的不同分辨率的低频和高频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧言科技(天津)有限公司,未经慧言科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910199508.1/1.html,转载请声明来源钻瓜专利网。