首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于语谱图的语音重采样检测方法有效

申请号：	201910491571.2	申请日：	2019-06-06
公开（公告）号：	CN110310660B	公开（公告）日：	2021-10-08
发明（设计）人：	张玉金;代淑娴;吴飞	申请（专利权）人：	上海工程技术大学
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/27;G10L19/00
代理公司：	上海科盛知识产权代理有限公司 31225	代理人：	叶敏华
地址：	201620 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语谱图语音采样检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语谱图的语音重采样检测方法，其特征在于，该方法包括下列步骤：

1)将原始语音生成重采样语音、原始压缩语音与重采样压缩语音，将生成的各语音组成所需语料库；

2)将语音原数据进行分帧，对每一帧语音均进行傅里叶变换，获取振幅图；

3)将每一帧语音的振幅图按帧移时间排列形成线性语谱图，随后将线性语谱图取对数，生成对数语谱图；

4)读取对数语谱图，将对数语谱图分成不同的区域，对各区域内的每个元素获取一个用以描述语谱图纹理变化的局部二值模式，随后根据得到的所有局部二值模式进行直方图统计，将直方图作为特征向量；

5)利用LIBSVM进行特征训练及分类，获取检测结果；

步骤3)中，采用的插值处理包括线性插值、样条插值与或三次方插值；

对数语谱图中横轴代表时间，纵轴代表频率，对数语谱图上每个元素的取值表示振幅的大小；语音信号看成k次谐波的叠加，假设信号f(x)的傅立叶展开式为：

其中，a₀/2为信号的直流分量，a_k为谐波分解出的余弦函数的振幅，k为谐波的阶次，b_k为谐波分解出的正弦函数的振幅，l为一半的周期长度，取样间隔为Δt，取样个数为N，x为对应时间序列的时间，所以x→iΔt，因此：

式中，i为采样点；

由此可得离散傅立叶级数为：

因此，语音信号的k次谐波为：

其中，k次谐波的频率f_k与时域周期T分别为：

可得出谐波的频率f_k与信号的总时长呈倒数关系，当时域周期发生倍数变化时，频域的范围也会发生相应的变化，当语音上采样的因子为q时，相当于时域拉伸q倍，对应于信号的每阶频率都会压缩q倍，下采样时，对离散信号再次进行p倍抽取，信号在时域上缩短了p倍，在频域上则会拉伸p倍。

2.根据权利要求1所述的一种基于语谱图的语音重采样检测方法，其特征在于，步骤5)中，利用LIBSVM进行特征训练的具体内容为：

将原始语音的特征与重采样语音的特征，原始压缩语音的特征与重采样压缩语音的特征分别作为样本数据输入LIBSVM进行网格搜索和5折交叉验证训练。

3.根据权利要求2所述的一种基于语谱图的语音重采样检测方法，其特征在于，步骤5)中，将样本数据分为75％的训练样本与25％的测试样本。

4.根据权利要求3所述的一种基于语谱图的语音重采样检测方法，其特征在于，步骤5)中，采用支持向量机对特征进行分类，并选取径向基核函数作为核函数。

5.根据权利要求4所述的一种基于语谱图的语音重采样检测方法，其特征在于，步骤5)中获取检测结果的具体内容为：

分别将从原始语音与重采样语音提取的特征向量作为两类样本输入LIBSVM，利用网格搜索和交叉验证求解径向基核函数中的参数c与g的最优值，根据最优训练参数寻找一个最优平面进行分类，将分类正确的样本个数比上总样本的个数，获取语音重采样分类准确率，获取的语音重采样分类准确率即为检测结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海工程技术大学，未经上海工程技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910491571.2/1.html，转载请声明来源钻瓜专利网。

上一篇：用重构频带能量信息值解码或编码音频信号的设备及方法
下一篇：一种两路实时广播音频延时和相似度的计算方法

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top