[发明专利]一种基于语谱图的语音重采样检测方法有效
申请号: | 201910491571.2 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110310660B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 张玉金;代淑娴;吴飞 | 申请(专利权)人: | 上海工程技术大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L19/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 201620 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语谱图 语音 采样 检测 方法 | ||
1.一种基于语谱图的语音重采样检测方法,其特征在于,该方法包括下列步骤:
1)将原始语音生成重采样语音、原始压缩语音与重采样压缩语音,将生成的各语音组成所需语料库;
2)将语音原数据进行分帧,对每一帧语音均进行傅里叶变换,获取振幅图;
3)将每一帧语音的振幅图按帧移时间排列形成线性语谱图,随后将线性语谱图取对数,生成对数语谱图;
4)读取对数语谱图,将对数语谱图分成不同的区域,对各区域内的每个元素获取一个用以描述语谱图纹理变化的局部二值模式,随后根据得到的所有局部二值模式进行直方图统计,将直方图作为特征向量;
5)利用LIBSVM进行特征训练及分类,获取检测结果;
步骤3)中,采用的插值处理包括线性插值、样条插值与或三次方插值;
对数语谱图中横轴代表时间,纵轴代表频率,对数语谱图上每个元素的取值表示振幅的大小;语音信号看成k次谐波的叠加,假设信号f(x)的傅立叶展开式为:
其中,a0/2为信号的直流分量,ak为谐波分解出的余弦函数的振幅,k为谐波的阶次,bk为谐波分解出的正弦函数的振幅,l为一半的周期长度,取样间隔为Δt,取样个数为N,x为对应时间序列的时间,所以x→iΔt,因此:
式中,i为采样点;
由此可得离散傅立叶级数为:
因此,语音信号的k次谐波为:
其中,k次谐波的频率fk与时域周期T分别为:
可得出谐波的频率fk与信号的总时长呈倒数关系,当时域周期发生倍数变化时,频域的范围也会发生相应的变化,当语音上采样的因子为q时,相当于时域拉伸q倍,对应于信号的每阶频率都会压缩q倍,下采样时,对离散信号再次进行p倍抽取,信号在时域上缩短了p倍,在频域上则会拉伸p倍。
2.根据权利要求1所述的一种基于语谱图的语音重采样检测方法,其特征在于,步骤5)中,利用LIBSVM进行特征训练的具体内容为:
将原始语音的特征与重采样语音的特征,原始压缩语音的特征与重采样压缩语音的特征分别作为样本数据输入LIBSVM进行网格搜索和5折交叉验证训练。
3.根据权利要求2所述的一种基于语谱图的语音重采样检测方法,其特征在于,步骤5)中,将样本数据分为75%的训练样本与25%的测试样本。
4.根据权利要求3所述的一种基于语谱图的语音重采样检测方法,其特征在于,步骤5)中,采用支持向量机对特征进行分类,并选取径向基核函数作为核函数。
5.根据权利要求4所述的一种基于语谱图的语音重采样检测方法,其特征在于,步骤5)中获取检测结果的具体内容为:
分别将从原始语音与重采样语音提取的特征向量作为两类样本输入LIBSVM,利用网格搜索和交叉验证求解径向基核函数中的参数c与g的最优值,根据最优训练参数寻找一个最优平面进行分类,将分类正确的样本个数比上总样本的个数,获取语音重采样分类准确率,获取的语音重采样分类准确率即为检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海工程技术大学,未经上海工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910491571.2/1.html,转载请声明来源钻瓜专利网。