[发明专利]一种用于语音基音频率提取的改进局部均值分解方法在审
申请号: | 201910553408.4 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110289007A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 张庆;贾林山;蒋婷婷 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 贺建斌 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于语音基音频率提取的改进局部均值分解方法,首先使用三次样条插值的迭代包络法计算语音信号的上、下包络,计算得到语音信号的局部均值函数和包络估计函数;在完成一次“筛选”之后,后续“筛选”过程使用分段三次埃尔米特多项式插值的迭代包络法计算语音信号的上、下包络从而获得新的局部均值函数和包络估计函数;在局部均值分解完成后,选择能量最大的分量计算其包络函数的频谱,最终获得语音信号的基音频率;本发明将具有消除欠包络的迭代包络法引入到局部均值分解方法中,并将高阶和低阶插值曲线结合来减缓过包络,由此构建信号的局部均值函数和包络估计函数,显著提升LMD方法在语音信号基音频率提取过程中的计算效率和收敛的稳定性。 | ||
搜索关键词: | 局部均值分解 包络 包络估计 均值函数 语音信号 包络法 迭代 计算语音信号 基音频率 频率提取 语音基音 筛选 包络函数 分量计算 构建信号 计算效率 三次样条 低阶 高阶 频谱 分段 收敛 改进 引入 | ||
【主权项】:
1.一种用于语音基音频率提取的改进局部均值分解方法,其特征在于,称使用分段三次埃尔米特多项式插值(Piecewise Cubic Hermite Interpolating Polynomial,PCHIP)曲线的迭代包络为PCHIP‑IE,称使用三次样条插值(Cubic Spline,CS)曲线的迭代包络为CS‑IE,包括以下步骤:1)设有语音信号x(t),计数变量C=1;2)如果C=1,使用CS‑IE求取语音信号x(t)的上包络为
和下包络为
则语音信号x(t)的局部均值函数m11(t)和包络估计函数a11(t)分别为![]()
如果C>1,使用PCHIP‑IE求取信号的上包络为
和下包络为
则语音信号x(t)的局部均值函数m11(t)和包络估计函数a11(t)分别为![]()
3)将局部均值函数m11(t)从语音信号x(t)中分离出来,然后除以包络估计函数a11(t),从而对其进行幅值解调,得到信号s11(t):
4)将计数变量C加1,然后将s11(t)作为新的语音信号x(t),重复步骤2)‑步骤3),直到得到一个纯调频信号s1n(t),满足1≤s1n(t)≤1,s1n(t)的包络估计函数满足a1(n+1)(t)≈1;给定一个阈值Δ,迭代终止条件设定为1‑Δ≤a1n(t)≤1+Δ;Δ设置的越小,分解越精确;5)把步骤1)‑步骤4)中产生的所有包络估计函数相乘得到包络信号a1(t):a1(t)=a11(t)a12(t)…a1n(t)6)将包络信号a1(t)与获得的纯调频信号s1n(t)相乘,得到语音信号x(t)的第一个PF分量PF1(t):PF1(t)=a1(t)s1n(t)7)将第一个PF分量从语音信号x(t)中分离出来,得到一个新的信号u1(t),将信号u1(t)作为新的语音信号x(t)重复步骤1)‑步骤6),循环k次,直到uk(t)为一个单调函数或者为止;
最终将语音信号x(t)分解成k个PF分量PFi(t),其中i=1,...,k,以及1个余项uk(t),将余项uk(t)记作R;8)选择能量最大的PF分量PFi(t)并计算其包络信号的频谱,从而获得语音信号x(t)的基音频率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910553408.4/,转载请声明来源钻瓜专利网。
- 上一篇:音频信号的频谱-动态
- 下一篇:周期性综合包络序列生成装置、方法、记录介质