[发明专利]语音信号频谱特征和深度学习的语音欺骗攻击检测方法有效
申请号: | 202011061172.1 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112201255B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 徐文渊;冀晓宇;王炎;周瑜;薛晖;金子植;石卓杨;闫琛 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/06;H04L9/40 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 频谱 特征 深度 学习 欺骗 攻击 检测 方法 | ||
1.一种基于频谱特征和深度卷积神经网络的语音重放攻击检测方法,其特征在于:
在电子设备的麦克风接收到语音信号后,对语音进行信号处理工作,然后提取特定的特征,最后把标记好的特征输入深度卷积神经网络的分类器SE-ResNet50进行训练,采用训练后的分类器对待测的语音信号进行语音活体检测,输出是否为人声发出语音还是重放语音攻击的结果;
所述方法具体如下:
1)信号处理:
对原始语音信号Voicein按照以下两步处理获得累积功率频谱Spow:
第一步采用短时傅里叶变换,短时傅里叶变换的过程如下:首先用长度为1024,重叠长度为768的周期性汉明窗对原始语音信号Voicein进行加窗处理,将原始语音信号Voicein分成多个长度为1024的数据帧,然后对每一个数据帧进行快速傅里叶变换,傅里叶变换的点数nfft为4096;
第二步将各数据帧快速傅里叶变换后的结果进行累加,得到一个长度为4096的向量,最后取向量的前2049个数据点作为累积功率频谱Spow;
2)特征提取:
利用累积功率频谱Spow进行特征提取,获得四种特征,分别是低频特征、能量分布特征、峰值特征和线性预测倒谱系数;
所述2)具体为:
2.1)低频特征
把信号处理中得到的累积功率频谱Spow作为输入,按照以下三步处理获得低频特征FV1:第一步是把累积功率频谱Spow等分为固定长度为W的语音段;第二步是对各个语音段内的值求和,并取前200个点构成语音中间向量pow,完成对累积功率频谱Spow作平滑处理;第三步是取语音中间向量pow的前50个点作为低频特征FV1,FV1是一个50维的向量,作为第一类特征;
2.2)能量分布特征
先计算语音中间向量pow的累计分布函数powcdf并绘制累计分布图,然后求取累计分布函数powcdf的线性相关系数ρ和二次曲线拟合系数q,组成能量分布特征FV2=[ρ,q],作为第二类特征;
2.3)峰值特征
求取累计分布图的极大值,并将大于预设阈值的极大值所在的点作为峰,由各个峰的值及其在累积功率频谱中对应的频率组成了峰数据集,求出峰的一系列统计量,统计量包括峰数据集S中峰的总数Npeak、峰数据集S中所有峰对应频率的平均值μpeak、峰数据集S中所有峰对应频率的标准差σpeak;并用六阶多项式来拟合各个峰的形状,获得六阶多项式的系数集合Pest;最后由统计量和六阶多项式的系数集合组成了峰值特征FV3=[Npeak,μpeak,σpeak,Pest],作为第三类特征;
2.4)线性预测倒谱系数
对原始语音信号Voicein进行处理获得线性预测倒谱系数(LPCC),作为第四类特征;
3)攻击检测:
建立了挤压激励残差网络的分类器,挤压激励残差网络包括了50个挤压激励残差块,每个挤压激励残差包括了残差块residual、加合块、全局池化层、两个卷积模块和Sigmoid激活函数,四种特征输入到残差块residual中,残差块residual的输出依次经全局池化层、两个卷积模块和Sigmoid激活函数后连接输入到尺度层scale,残差块residual的输出同时也输入到尺度层scale,尺度层scale经过重塑Reshape操作升维到输入的维度后输出到加合块,原始的四种特征同时也输入到加合块,加合块经过加权操作后输出最终概率预测结果。
2.根据权利要求1所述的一种基于频谱特征和深度卷积神经网络的语音重放攻击检测方法,其特征在于:所述深度卷积神经网络的分类器SE-ResNet50包括依次连接构成的第一卷积层组、第二卷积层组、第三卷积层组、第四卷积层组、第五卷积层组、一个平均池化层、一个全连接层和一个Sigmoid层;挤压激励残差网络在分类器训练时输入语音信号的四种特征以及对应的已知是否为人声发出语音还是重放语音攻击的标签而进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011061172.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电驱动总成系统和车辆
- 下一篇:一种新型卧床病患用恒温水杯