[发明专利]语音降噪方法及电子设备在审
申请号: | 202010376975.X | 申请日: | 2020-05-07 |
公开(公告)号: | CN111415674A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 张东魁;冯大航;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0224;G10L21/0232;G10L25/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;左晓菲 |
地址: | 100098 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 方法 电子设备 | ||
本发明提供一种语音降噪方法及电子设备,所述方法包括:基于待处理语音获取第一语音,其中,所述待处理语音包括N帧信号,所述第一语音的第i帧信号包括所述待处理语音的第i帧至第i+J帧信号,N和J均为正整数,i为1至N‑J中的任意值;将所述第一语音输入用于降噪的LSTM长短期记忆神经网络;基于所述LSTM神经网络的输出获取降噪处理后的语音。本发明实施例能够提高语音降噪效果。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语音降噪方法及电子设备。
背景技术
自然语言是指通过自然进化产生的人类之间用于交流的语言。自然语言处理(Natural Language Processing,NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理技术可以采用网络模型对语音进行处理,满足各个使用场景的需求,例如,在语音识别使用场景,可以采用语音识别网络模型将语音处理为文字。
语音中通常包含噪声,在采用网络模型对语音进行处理之前,需要对语音进行降噪。现有技术中,通常采用滤波器对语音进行降噪,而滤波器对非线性噪声的抑制效果较差,使得降噪效果较差。
发明内容
本发明实施例提供一种语音降噪方法及电子设备,以解决现有技术中采用滤波器对语音进行降噪的降噪效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种语音降噪方法,应用于电子设备,所述方法包括:
基于待处理语音获取第一语音,其中,所述待处理语音包括N帧信号,所述第一语音的第i帧信号包括所述待处理语音的第i帧至第i+J帧信号,N和J均为正整数,i为1至N-J中的任意值;
将所述第一语音输入用于降噪的LSTM长短期记忆神经网络;
基于所述LSTM神经网络的输出获取降噪处理后的语音。
第二方面,本发明实施例提供了一种电子设备,所述电子设备包括:
第一获取模块,用于基于待处理语音获取第一语音,其中,所述待处理语音包括N帧信号,所述第一语音的第i帧信号包括所述待处理语音的第i帧至第i+J帧信号,N和J均为正整数,i为1至N-J中的任意值;
输入模块,用于将所述第一语音输入用于降噪的LSTM长短期记忆神经网络;
第二获取模块,用于基于所述LSTM神经网络的输出获取降噪处理后的语音。
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的语音降噪方法中的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的语音降噪方法中的步骤。
本发明实施例中,基于待处理语音获取第一语音,其中,所述待处理语音包括N帧信号,所述第一语音的第i帧信号包括所述待处理语音的第i帧至第i+J帧信号,N和J均为正整数,i为1至N-J中的任意值;将所述第一语音输入用于降噪的LSTM长短期记忆神经网络;基于所述LSTM神经网络的输出获取降噪处理后的语音。这样,通过对待处理语音的连续M帧信号进行拼接处理,将拼接处理后的语音信号输入LSTM神经网络进行降噪处理,能够同时消除线性噪声和非线性噪声,从而能够提高降噪效果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010376975.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种降噪吸油烟机
- 下一篇:一种同振式矢量传感器校准系统和方法