[发明专利]一种改进多分辨率残差U型网络的语音增强方法在审

申请号：	202111026177.5	申请日：	2021-09-02
公开（公告）号：	CN113707164A	公开（公告）日：	2021-11-26
发明（设计）人：	兰朝风;刘春东;周贤武;韩玉兰;郭小霞	申请（专利权）人：	哈尔滨理工大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L25/27;G10L25/30;G10L25/45;G10L25/69;G10L15/02;G10L15/06
代理公司：	暂无信息	代理人：	暂无信息
地址：	150080 黑龙***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种深度神经网络，特别涉及一种改进多分辨率残差U型网络语音增强方法，为使得传统的多分辨率残差U型网络更加适用于时频域上的语音增强任务，针对其在解码阶段恢复出低信噪比下的语音细节的能力弱、容易造成语音特征丢失的问题进行改进，同时改变了卷积核的大小以适应语音信号转化到时频域后通常得到的语音特征图的尺寸是宽度远大于高度的特点，属于语音增强领域。本发明包括：S1、将纯净和带噪语音通过短时傅里叶变换得到两种语音信号的幅度谱；S2、以带噪语音幅度谱作为网络的输入，纯净语音幅度谱作为训练目标；通过改进的多分辨率残差U型网络拟合网络输入与训练目标之间的非线性关系，进而得到基于改进的多分辨率残差U型网络的语音增强模型；S3、通过STFT获取带噪语音的幅度谱；将其通过改进的多分辨率残差U型网络模型，即可得到目标语音的幅度谱；S4、将幅度谱与带噪语音相位结合，进行波形重建，重建后即可得到增强语音。
搜索关键词：	一种改进分辨率网络语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学，未经哈尔滨理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202111026177.5/，转载请声明来源钻瓜专利网。

上一篇：含活性成分的益生菌及其制备方法、用途
下一篇：一种自动初始化Snake模型的X光胸片肺野分割方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种改进多分辨率残差U型网络的语音增强方法在审

专利文献下载