[发明专利]一种基于WaveNet的骨导语音增强波形生成方法有效

申请号：	201910590941.8	申请日：	2019-07-02
公开（公告）号：	CN110648684B	公开（公告）日：	2022-02-18
发明（设计）人：	张雄伟;郑昌艳;杨吉斌;曹铁勇;李莉;孙蒙	申请（专利权）人：	中国人民解放军陆军工程大学
主分类号：	G10L21/0232	分类号：	G10L21/0232;G10L21/0332;G10L25/18;G10L25/27
代理公司：	南京理工大学专利中心 32203	代理人：	薛云燕
地址：	210007 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于WaveNet的骨导语音增强波形生成方法。该方法在基于BLSTM模型的骨导语音幅度谱增强基础上，采用WaveNet模型生成高质量语音。首先构建BLSTM模型和WaveNet模型，WaveNet模型中引入了跨采样率的上采样模块，并对两个模型分别进行训练；然后将待增强的低采样率下骨导语音幅度谱送入训练好的BLSTM模型中得到增强的幅度谱，再联合骨导语音相位信息送入训练好的WaveNet模型中，得到增强的高采样率下语音波形。本发明有效利用了骨导语音相位信息并且拥有频谱扩展功能，能够从增强的骨导语音幅度谱以及骨导语音相位信息直接生成增强的高采样率语音波形，显著提升了骨导语音的质量。
搜索关键词：	一种基于 wavenet 导语增强波形生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于WaveNet的骨导语音增强波形生成方法，其特征在于，包括以下步骤：/n步骤1、构建基于BLSTM的幅度谱增强模型和基于WaveNet的波形生成模型，在基于WaveNet的波形生成模型中引入跨采样率的上采样模块；/n步骤2、分别训练基于BLSTM的幅度谱增强模型和基于WaveNet的波形生成模型，其中基于BLSTM的幅度谱增强模型的输入为采样率s

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学，未经中国人民解放军陆军工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910590941.8/，转载请声明来源钻瓜专利网。

上一篇：计算机X射线断层成像系统上消除噪声的方法和装置
下一篇：设备检测方法、装置、电子设备和可读存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于WaveNet的骨导语音增强波形生成方法有效

专利文献下载