[发明专利]基于集成学习与噪声感知训练的语音增强方法有效

申请号：	201811385650.7	申请日：	2018-11-20
公开（公告）号：	CN109256144B	公开（公告）日：	2022-09-06
发明（设计）人：	王兮楼;郭武	申请（专利权）人：	中国科学技术大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L21/0216;G10L21/0232;G10L25/30
代理公司：	北京凯特来知识产权代理有限公司 11260	代理人：	郑立明;郑哲
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于集成学习与噪声感知训练的语音增强方法，相比于静态噪声感知训练，能较为准确地跟踪非平稳噪声，同时，利用梯度提升决策树可以自发提取特征的特性，获得对每一个时频单元的噪声场景编码，为深度神经网络提供噪声的额外信息，而传统的噪声感知训练方法只能够获得噪声的幅度信息。从实验结果来看，本方法也优于采用静态噪声感知训练的语音增强方法。
搜索关键词：	基于集成学习噪声感知训练语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于集成学习与噪声感知训练的语音增强方法，其特征在于，包括：训练阶段：利用输入的带噪语音信号，训练用于动态噪声感知的梯度提升决策树模型；利用训练好的梯度提升决策树模型来估计带噪语音信号每个频带估计的噪声幅值以及噪声特征；将估计的噪声幅值以及噪声特征与带噪语音信号的对数频谱特征拼接起来，训练深层神经网络；测试阶段：将待增强的带噪语音信号输入之前训练的梯度提升决策树模型，得到估计的噪声幅值及噪声特征，并与待增强的语音信号的对数频谱特征拼接起来，再输入至训练好的深层神经网络，由深层神经网络的输出层预测干净语音的对数频谱特征，再结合待增强的带噪语音信号的相位，使用重叠相加法对进行波形重构，得到增强后的语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811385650.7/，转载请声明来源钻瓜专利网。

上一篇：语音参数量化方法、装置、计算机设备和存储介质
下一篇：基于终端的音频处理方法、装置、终端和可读存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于集成学习与噪声感知训练的语音增强方法有效

专利文献下载