[发明专利]利用语音振幅信息和多种相位检测语音欺诈重放攻击方法在审
申请号: | 201910199508.1 | 申请日: | 2019-03-15 |
公开(公告)号: | CN109841219A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 李东播;关昊天 | 申请(专利权)人: | 慧言科技(天津)有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/06;G10L25/51 |
代理公司: | 北京栈桥知识产权代理事务所(普通合伙) 11670 | 代理人: | 潘卫锋 |
地址: | 300384 天津市西青区天津华苑产业*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用语音振幅信息和多种相位检测语音欺诈重放攻击方法,主要包括以下几个步骤:S1:提取不同的相位特征以及振幅特征;S2:使用GMM模型进行判别式训练;S3:在分数级别进行信息融合获得判别结果。本发明充分考虑到了语音中的相位信息,充分利用存在在语音中的相关信息,通过融合不同的相位信息,分析相位与振幅之间的互补性,具有能自动判断语音为真实语音还是重放语音,对语音欺诈检测非常有效。 | ||
搜索关键词: | 语音 相位检测 相位信息 振幅信息 重放攻击 欺诈 判别结果 欺诈检测 相关信息 相位特征 信息融合 真实语音 振幅特征 自动判断 判别式 互补性 融合 分析 | ||
【主权项】:
1.一种利用语音振幅信息和多种相位检测语音欺诈重放攻击方法,其特征在于,主要包括以下步骤:S1:振幅特征以及相位特征提取:所述振幅特征为CQCC特征,所述相位特征为Mel‑RP特征以及MPVT特征;其中,振幅特征的提取是通过将使用恒Q变换将频率仓的几何空间转化为线性空间;相位特征的提取主要通过了预处理方法得到相位谱,然后在此基础上进行处理;S2:进行各特征模型训练;S3:分数级别特征融合:如步骤S2进行模型训练,并且使用以下模型来获得真实语音和欺骗语音之间的对数似然之间的差异来进行计算分数;S=log(P(X|θg))‑log(P(X|θs))其中,P表示的是似然函数,X表示的是特征向量序列,θg和θs分别为真实语音与欺诈语音的模型的参数;使用分数级别特征融合的方法,在得分水平上组合两个系统之间的信息,获得信息增益并改善组合系统的最终结果;对于两个得分组合,使用线性组合的方法;对于两个系统分数级别的信息融合,使用如下方式进行组合:Lcomp=(1‑α)L1+αL2
针对三个独立模型进行分数级别的信息融合,使用以下公式进行信息融合:Lcomp=αL1+βL2+(1‑α‑β)L3
其中,L1和L2分别表示两个独立的模型的分数,
和
表示的是两个独立模型分数的均值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧言科技(天津)有限公司,未经慧言科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910199508.1/,转载请声明来源钻瓜专利网。