[发明专利]攻击语音检测方法、装置、设备及介质在审
申请号: | 202210592514.5 | 申请日: | 2022-05-27 |
公开(公告)号: | CN114898758A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 魏林强 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L17/02;G10L17/06;G10L25/21;G10L25/24 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 攻击 语音 检测 方法 装置 设备 介质 | ||
本申请涉及声纹识别技术领域,提供一种攻击语音检测方法、装置、设备及介质,方法包括:获取待检测的语音信号;对待检测的语音信号进行预处理,得到预处理后的语音信号;根据预处理后的语音信号,采用线性预测算法提取残差信号;从残差信号中提取线性频率倒谱系数特征;从残差信号中提取常数Q倒谱系数特征;将线性频率倒谱系数特征和常数Q倒谱系数特征进行拼接,得到拼接后的特征;将拼接后的特征输入到预设的模型进行检测,得到检测结果。由于本实施例通过采用线性预测算法提取到的残差信号、线性频率倒谱系数特征和常数Q倒谱系数特征能够反映出真实语音和攻击语音的差异,因此,本申请能够有效地识别出待检测的语音是攻击语音还是真实语音。
技术领域
本申请涉及声纹识别技术领域,尤其涉及一种攻击语音检测方法、装置、设备及介质。
背景技术
近年来,声纹识别技术已经在多种认证场景中得到广泛的应用,例如,智能手机和平板电脑的声纹锁使用语音进行登录认证。随着深度学习和机器学习的发展,虽然声纹识别系统的识别准确率逐渐提高,但是合成声纹技术也在日益进步。若不法分子通过合成算法生成目标用户的声纹,再采用这种声纹去攻击声纹识别系统,那么将会对声纹识别系统带来极大的威胁,从而导致用户的信息安全得不到保障。然而,目前国内外工业界还没有一种能够有效检测出攻击语音的方法(攻击语音包括合成语音、采用录音设备录制的语音等),给声纹识别系统的应用和推广带来了巨大的阻碍。
发明内容
针对上述技术问题,本申请的目的在于提供一种攻击语音检测方法、装置、设备存储介质,旨在解决目前还没有一种能够有效检测出攻击语音的方法的技术问题。
为了解决上述技术问题,第一方面,本申请实施例提供一种攻击语音检测方法,包括:
获取待检测的语音信号;
对所述待检测的语音信号进行预处理,得到预处理后的语音信号;
根据所述预处理后的语音信号,采用线性预测算法提取残差信号;
从所述残差信号中提取线性频率倒谱系数特征;
从所述残差信号中提取常数Q倒谱系数特征;
将所述线性频率倒谱系数特征和所述常数Q倒谱系数特征进行拼接,得到拼接后的特征;
将所述拼接后的特征输入到预设的模型进行检测,得到检测结果;其中,所述检测结果为所述语音信号是否为攻击语音信号。
进一步的,所述根据所述预处理后的语音信号,采用线性预测算法提取残差信号,包括:
基于线性预测算法的预测系数、线性预测的阶数,采用线性预测算法计算得到预测出的语音信号;
根据所述预测出的语音信号和所述预处理后的语音信号提取残差信号。
进一步的,所述基于线性预测算法的预测系数、线性预测的阶数,采用线性预测算法计算得到预测出的语音信号,具体包括:
根据公式计算得到预测出的语音信号;
其中,表示预测出的语音信号,ck表示线性预测算法的预测系数,k表示线性预测的阶数,取值为[1-p],S(t-a)表示当前时刻前的语音信号,t表示当前时间点,a表示t时刻之前的时间点。
进一步的,所述根据所述预测出的语音信号和所述预处理后的语音信号提取残差信号,具体包括:
根据公式提取残差信号;
其中,r(t)表示残差信号,S(t)表示预处理后的语音信号,表示预测出的语音信号。
进一步的,所述从所述残差信号中提取线性频率倒谱系数特征,包括:
将所述残差信号转换为频域信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210592514.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含三七素的修护霜及其制备方法
- 下一篇:一种梁式桥加固装置及其实施方法