[发明专利]基于希尔伯特黄变换的语音特征系数提取方法及相关设备在审
申请号: | 202010781082.3 | 申请日: | 2020-08-06 |
公开(公告)号: | CN111899724A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 胡乔林;王亨佳;刘剑豪;赵国林;王良斯;石子言;都兴霖 | 申请(专利权)人: | 中国人民解放军空军预警学院 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L19/02;G10L25/24;G06F17/14 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 尹均利 |
地址: | 430019 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 希尔伯特 变换 语音 特征 系数 提取 方法 相关 设备 | ||
本发明公开了一种基于希尔伯特黄变换的基于希尔伯特黄变换的语音特征系数提取方法,包括将输入的语音信号进行经验模态分解,得到若干个固有模态函数;将各个固有模态函数进行希尔伯特谱分析,得到各个固有模态函数的希尔伯特边际谱;将各个固有模态函数的希尔伯特边际谱分别进行滤波,得到语音信号在不同频率分量上的幅值响应;对所述的幅值响应提取对数能量谱,将得到的对数能量谱进行离散余弦变换变换,得到一种新的梅尔倒谱系数。本发明技术方案区分说话人性能较好,而且还反映出了语音信号更真实的频谱特性分布。
技术领域
本发明涉及语音处理技术领域,特别涉及一种基于希尔伯特黄变换的基于希尔伯特黄变换的语音特征系数提取方法及相关设备。
背景技术
特征系数提取是指从说话人语音中提取出可以表达说话人特性信息的过程,是识别说话人声音中首要环节,具有举足轻重的地位。
目前,应用最为广泛的特征参数是MFCC(Mel-scale Frequency CepstralCoefficient,梅尔频率倒谱系数),MFCC是基于人耳的听觉感知特性提取的,较为准确描述了人耳听觉频率的非线性特性。但是MFCC是基于傅里叶变换的基础上提取的,傅里叶变换在分析语音信时存在一个先验假设,即语音具有短时平稳特性。基于这个假设,将在分析语音信号之前,先将语音信号通过分帧加窗的方式分为若干个短时段,在每个短时段内进行短时傅里叶变换,以此来分析语音信号的时频特性。但是从严格意义上来讲,语音信号是一种非线性非平稳信号,这种分帧截断的方式会导致语音频谱的泄露,导致不能真实反映语音的频谱特性。
发明内容
本发明的目的在于针对现有技术的不足之处,提供一种基于希尔伯特黄变换的基于希尔伯特黄变换的语音特征系数提取方法,旨在解决现有的基于希尔伯特黄变换的语音特征系数提取方法存在语音频谱的泄露,导致不能真实反映语音的频谱特性的问题。
本发明提供了一种基于希尔伯特黄变换的语音特征系数提取方法,包括以下步骤:
将输入的语音信号进行经验模态分解,得到若干个固有模态函数;
将各个固有模态函数进行希尔伯特谱分析,得到各个固有模态函数的希尔伯特边际谱;
将各个固有模态函数的希尔伯特边际谱分别进行滤波,得到语音信号在不同频率分量上的幅值响应;
对所述的幅值响应提取对数能量谱,将得到的对数能量谱进行离散余弦变换变换,得到梅尔倒谱系数。
优选地,在所述将输入语音信号进行经验模态分解,得到若干个固有模态函数之前,还包括:
对输入的初始音频信号进行预处理,使语音信号更纯净、更突出、更易提取特征。其中预加重公式为:
y(n)=x(n)-μx(n-1)
其中,μ为预加重系数,y(n)是预加重处理以后的语音信号,x(n)及x(n-1)均为初始音频信号。
优选地,所述将语音信号进行经验模态分解,得到若干个固有模态函数,具体包括:
获取初始音频信号的所有的局部极大值和所有的局部极小值;
对所有的局部极大值和所有的局部极小值分别进行预设次数的样条插值,以生成若干个固有模态函数。
优选地,所述对所有的局部极大值和所有的局部极小值分别进行预设次数的样条插值,以生成若干个固有模态函数,具体包括:
根据所有的局部极大值生成上包络线,根据所有的局部极小值生成下包络线;
计算所述上包络线与所述下包络线的平均值;
基于所述平均值及预设规则生成若干个固有模态函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军空军预警学院,未经中国人民解放军空军预警学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010781082.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效率倒挡箱体
- 下一篇:一种新型喷水推进泵装置结构及其运行方法