[发明专利]用于语音清晰度增强的宽带语音频谱倾斜度特征参数重建方法有效
申请号: | 201811249506.0 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109215635B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 胡瑞敏;李罡;张锐;王晓晨 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L21/02;G10L25/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种用于语音清晰度增强的宽带语音频谱倾斜度特征参数重建方法,包括基于循环神经网络的频谱倾斜度重建网络的训练阶段和使用阶段,训练阶建立语音数据集,对数据集中的语音资料进行预处理;输入预处理后的窄带语音资料,进行短时傅里叶变换得到窄带语音频谱,将频谱信息对数化获取对数幅度谱;输入预处理后的宽带语音资料,提取宽带语音信号频谱倾斜度的全极点模型参数,转化成线性频谱对参数;训练频谱倾斜度重建网络并使用,重建宽带语音频谱倾斜度的全极点模型参数。本发明根据窄带语音信号重建宽带语音信号频谱倾斜度参数,适用于所有基于频谱倾斜度特征的语音清晰度增强系统之中,且可适配多语种、多模态的语音信号。 | ||
搜索关键词: | 用于 语音 清晰度 增强 宽带 频谱 倾斜度 特征 参数 重建 方法 | ||
【主权项】:
1.一种用于语音清晰度增强的宽带语音频谱倾斜度特征参数重建方法,其特征在于:包括基于循环神经网络的频谱倾斜度重建网络的训练阶段和使用阶段,所述的频谱倾斜度重建网络训练阶段包括以下步骤,步骤S11,通过对高采样率的宽带语音资料降采样获取低采样率的窄带语音资料,建立语音数据集,按比例分成训练集和测试集、验证集语音资料,对数据集中的语音资料进行预处理,所述预处理包括分帧和加窗;步骤S12,输入预处理后的窄带语音资料训练集,进行短时傅里叶变换得到窄带语音频谱,将频谱信息对数化获取对数幅度谱作为频谱倾斜度重建网络的输入;步骤S13,输入预处理后的宽带语音资料训练集,提取宽带语音信号频谱倾斜度的全极点模型参数,转化成线性频谱对参数,作为频谱倾斜度重建网络的输出;步骤S14,训练频谱倾斜度重建网络,定义感知均方根偏差PRMSD作为评估方法测试频谱倾斜度网络性能,每次评估使用验证集作为评价标准,调试出最优重建网络参数模型,并在测试集中验证最终效果;所述的频谱倾斜度重建网络使用阶段将已训练好的神经网络投入到实际通信的实时语音逐帧处理中,包括以下步骤,步骤S21,实时逐帧输入窄带语音,提取窄带语音的对数幅度谱参数;步骤S22,逐帧输入宽带语音对数幅度谱参数,结合频谱倾斜度重建网络和参数转换重建宽带语音频谱倾斜度的全极点模型参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811249506.0/,转载请声明来源钻瓜专利网。