[发明专利]基于超完备傅里叶基的语音信号稀疏表示方法有效
申请号: | 201510229462.5 | 申请日: | 2015-05-07 |
公开(公告)号: | CN104978972B | 公开(公告)日: | 2018-08-10 |
发明(设计)人: | 刘冠群;张汝波;杨大伟;唐莉莉;吴俊伟 | 申请(专利权)人: | 大连民族学院 |
主分类号: | G10L25/27 | 分类号: | G10L25/27 |
代理公司: | 大连一通专利代理事务所(普通合伙) 21233 | 代理人: | 秦少林 |
地址: | 116600 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于超完备傅里叶基的语音信号稀疏表示方法,其步骤是:根据需要构造超完备傅里叶基;将输入信号进行分帧,进行线性预测估计,获得线性预测系数;利用所获得的线性预测系数求线性预测谱;搜索线性预测谱的局部极大值,获得当前帧语音的共振峰数目;将所获得共振峰数作为依据,利用超完备傅里叶基进行稀疏逼近,以获得稀疏表示系数,即获得语音信号的稀疏表示,从而完成语音信号的稀疏表示。本发明利用线性预测谱的局部极大值与语谱中的共振峰之间的对应关系,通过搜索线性预测谱局部极大值获得的共振峰数目,为稀疏系数中非零元的数目提供了依据,提高了语音稀疏逼近的性能。 | ||
搜索关键词: | 基于 完备 傅里叶基 语音 信号 稀疏 表示 方法 | ||
【主权项】:
1.一种基于超完备傅里叶基的语音信号稀疏表示方法,其特征在于该方法内容包括如下步骤:(1)根据需要的频率分辨率构造超完备傅里叶基;设待稀疏表示信号的帧长为N,令e(ω)=[1 ejω ej2ω … ej(N‑1)ω]T式中的ω为离散频率点,设所需的频率分辨率为Δ=2π/M,式中M是频率分辨率控制参数,为整数,M决定超完备傅里叶基的频率分辨率,M>N,M的值越大,则频率分辨率越高;则超完备傅里基A为A=[e(0) e(Δ) … e(2π‑Δ)]A的维数为N×M;(2)将输入信号进行分帧,分帧后的信号为s(n),长度为N,建立P阶线性预测模型,使用Durbin递推算法进行线性预测估计,获得P个线性预测系数,并组成线性预测系数向量a=[a1 a2 … aP];(3)利用所获得的线性预测系数向量a求线性预测谱H(ejω)式中的G为增益因子,可以设为1;(4)对数字频带[0,π)进行抽样,抽样间隔为θ=π/L,式中L为抽样间隔控制参数,L>0,且为整数,L决定所得到的线性预测谱的光滑程度,L的大小可以根据需要进行设定,L越大,所得到的线性预测谱幅值越光滑,将ω=ejnθ(0≤n<L)代入|H(ejω)|,可得离散化的线性预测谱幅值,搜索线性预测谱幅值的局部极大值,根据预先设定的终止条件,可获得线性预测谱幅值的m个局部极大值,即为当前帧语音的共振峰数目;(5)将步骤(4)所获得共振峰数m作为依据,利用超完备傅里叶基进行稀疏逼近,以获得稀疏表示系数,即获得语音信号的稀疏表示;(6)重复步骤(2)‑(5),直至任务结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族学院,未经大连民族学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510229462.5/,转载请声明来源钻瓜专利网。
- 上一篇:紧凑型三维存储器
- 下一篇:语音控制指令纠错方法和系统