[发明专利]一种用于语音重放检测的特征提取方法及装置有效
申请号: | 201810191512.9 | 申请日: | 2018-03-08 |
公开(公告)号: | CN108364656B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 郑方;李通旭;邬晓钧 | 申请(专利权)人: | 北京得意音通技术有限责任公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L25/18;G10L25/78 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 100000 北京市海淀区清华*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 重放 检测 特征 提取 方法 装置 | ||
1.一种用于语音重放检测的特征提取方法 ,其特征在于,包括:
对获取的语音信号进行1.5维谱估计,得到语音信号的1.5维谱特征;
采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后的语音信号的能量分布特征;
对所述语音信号的1.5维谱特征和规整后的能量分布特征进行融合,得到1.5 维谱能量分布融合SFED特征,所述1.5 维谱能量分布融合SFED特征用于构建进行语音重放检测的分类器。
2.根据权利要求1所述的方法,其特征在于,所述采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后语音信号的能量分布特征之前,还包括:
对所述语音信号进行语音活动检测,检测出所述语音信号的静音段数据,并去除所述语音信号的静音段数据。
3.根据权利要求2所述的方法,其特征在于,所述采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后语音信号的能量分布特征之前,还包括:
对去除静音段数据的语音信号依次进行预加重、分帧、加窗、快速傅立叶变换处理,得到语音信号的频谱。
4.根据权利要求1-3任一所述的方法,其特征在于,所述对获取的语音信号进行1.5维谱估计,得到语音信号的1.5维谱特征,包括:
对获取的语音信号进行采样,并按照语音信号的播放时间顺序将采样得到的语音采样值均匀分成不同的采样段;其中,每个采样段中分别包括多个语音采样值;
根据每个采样段中的多个语音采样值,分别计算各采样段的三阶累积量;
计算语音信号的所有采样段的三阶累积量的累积量平均值,将所述累积量平均值作为所述语音信号的三阶累积量估计值;
对所述语音信号的三阶累积量估计值进行双谱估计,得到所述语音信号的双谱特征;
对语音信号的双谱特征进行投影操作,得到语音信号的1.5维谱特征。
5.根据权利要求1所述的方法,其特征在于,所述对所述语音信号的1.5维谱特征和规整后的能量分布特征进行融合,得到1.5 维谱能量分布融合SFED特征,具体包括:
将所述语音信号的1.5维谱特征和规整后的能量分布特征采用线性叠加的方式进行特征融合,得到融合后的声学特征;
对所述融合后的声学特征进行降维度处理。
6.根据权利要求1所述的方法,其特征在于,还包括:
利用如权利要求1-5任一所述的方法分别获得训练样本中原始语音信号和重放语音信号的1.5维谱能量分布融合SFED特征参数,构建二元分类器。
7.根据权利要求6所述的方法,其特征在于,还包括:
当获取用户新的语音信号时,对新的语音信号提取语音重放检测特征,然后基于所述二元分类器,检测该新的语音信号是否为重放语音。
8.一种用于语音重放检测的特征提取装置,其特征在于,包括:
估计模块,用于对获取的语音信号进行1.5维谱估计,得到语音信号的1.5维谱特征;
规整模块,用于采用弯折函数对所述语音信号的频域空间的能量分布函数进行分段规整,得到规整后的语音信号的能量分布特征;
融合模块,用于对所述语音信号的1.5维谱特征和规整后的能量分布特征进行融合,得到1.5维谱能量分布融合SFED特征,所述1.5 维谱能量分布融合SFED特征用于构建进行语音重放检测的分类器。
9.根据权利要求8所述的装置,其特征在于,还包括:检测模块,用于在采用弯折函数对所述语音信号的频域空间的能量进行分段规整,得到规整后语音信号的能量分布特征之前,对所述语音信号进行语音活动检测,检测出所述语音信号的静音段数据,并去除所述语音信号的静音段数据。
10.根据权利要求9所述的装置,其特征在于,还包括:滤波模块,用于在采用弯折函数对所述语音信号的频域空间的能量进行分段规整,得到规整后语音信号的能量分布特征之前,对去除静音段数据的语音信号依次进行预加重、分帧、加窗、快速傅立叶变换处理,得到语音信号的频谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京得意音通技术有限责任公司,未经北京得意音通技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810191512.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音处理方法、介质、装置和计算设备
- 下一篇:处理丢失帧的方法和解码器