[发明专利]一种语音降噪方法有效
申请号: | 201811379108.0 | 申请日: | 2018-11-19 |
公开(公告)号: | CN109378013B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 郝小龙;韩斌;樊强;彭启伟;薛依铭;王学广;贾政;张铁勋;崔漾 | 申请(专利权)人: | 南瑞集团有限公司;南京南瑞信息通信科技有限公司 |
主分类号: | G10L21/0264 | 分类号: | G10L21/0264;G10L21/0232;G10L25/21;G10L25/87 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 马林中 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音降噪方法,结合传统的信号处理方法和神经网络模型,二者取长补短,先使用传统的信号处理方法对音频信号进行处理,能够滤除一部分均匀的环境噪声,如白噪声,使得后续的神经网络模型能够主要处理其他噪声,如汽车鸣笛,其他人声音等,同时,本方法对带噪语音样本执行VAD操作,去掉了非必要的信号,能够一定程度训练和降噪的效果,解决了传统信号处理方法可扩展性差,不同的噪声环境需要不同的;神经网络虽然能够处理所有噪声情况,但是该方法非常依赖于训练样本的问题。 | ||
搜索关键词: | 一种 语音 方法 | ||
【主权项】:
1.一种语音降噪方法,包括基于神经网络模型的深度降噪模型,其特征在于:还包括以下步骤:A、对带噪语音信号进行预处理得到预处理过的语音信号;B、使用语音端点检测技术VAD对步骤A中预处理过的语音信号进行端点检测,根据信号的短时能量和过零率,确定该段语音信号的有效起点和终点;C、根据步骤B检测到语音信号的有效起点和终点,剪裁整个语音信号;D、将步骤C中裁剪后的语音信号转换为预定格式的带噪语音信号;E、将步骤D中预定格式的带噪语音信号切片成固定长度;F、将步骤E中的带噪语音信号切片作为深度降噪模型的输入,通过深度降噪模型,得到干净的语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南瑞集团有限公司;南京南瑞信息通信科技有限公司,未经南瑞集团有限公司;南京南瑞信息通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811379108.0/,转载请声明来源钻瓜专利网。