[发明专利]一种语音处理的方法、装置及电子设备在审
申请号: | 202011062283.4 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112053702A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 陈昌儒;包英泽 | 申请(专利权)人: | 北京大米科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/12;G10L25/24;G10L25/30;G10L25/60;G10L25/87 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋;杨春晓 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 电子设备 | ||
本发明提供了一种语音处理的方法、装置及电子设备,包括:获取包括至少一个音频信号帧的音频数据;根据各音频信号帧确定所述音频数据的类型,所述类型包括需要降噪和不需要降噪;响应于所述音频数据的类型为需要降噪,确定所述音频数据的信号特征;将所述信号特征输入到预先训练的降噪模型中,确定降噪后的音频数据。通过这种方式,通过降噪模型对音频数据进行处理,能够有效的对音频数据中的噪音进行降噪,获取噪音较小的音频数据。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音处理的方法、装置及电子设备。
背景技术
随着科技的不断发展,自动语音识别技术的应用也越来越广泛;由于是语音信号在不同的语音环境中不断受到各种噪音的干扰,会影响语音识别的结果,因此,需要对语音信号进行语音增强,即对语音信号中的噪音进行降噪处理。
现有技术中,通常采用传统的降噪方法,例如谱减法、维纳滤波法以及小波变换等算法实现平稳噪音或非平稳噪音的消除,但是在实际场景中往往面对多种类、宽频域、非平稳的噪音,传统的降噪算法效果往往并不理想的效果;而且对于一些极低信噪比、以及鸡尾酒效应明显的场景,降噪性能也较差。
综上所述,如何对语音信号中的各种噪音进行有效的降噪,获取噪音较小的音频,是目前需要解决的问题。
发明内容
本发明实施例提供了一种语音处理的方法、装置及电子设备,可以有效的对音频数据中的噪音进行降噪,获取噪音较小的音频数据。
根据本发明实施例的第一个方面,提供了一种语音处理的方法,包括:获取包括至少一个音频信号帧的音频数据;根据各音频信号帧确定所述音频数据的类型,所述类型包括需要降噪和不需要降噪;响应于所述音频数据的类型为需要降噪,确定所述音频数据的信号特征;将所述信号特征输入到预先训练的降噪模型中,确定降噪后的音频数据。
在一个实施例中,所述方法还包括:所述根据各音频信号帧确定所述音频数据的类型具体包括:确定所述音频数据的各音频信号帧中语音帧的信噪比,以及所述各音频信号帧中的非语音帧中含噪音段的非语音帧,其中,语音帧为包含非噪声信号的音频信号帧,所述非语音帧为不包含非噪声信号的音频信号帧;确定所述信噪比小于第一设定阈值的音频信号帧的第一数量,以及所述含噪音段的非语音帧的第二数量;根据所述第一数量和所述第二数量确定第三数量;响应于所述第三数量与音频信号帧的总数的比值大于或等于第二设定阈值;确定所述音频数据的类型为需要降噪。
在一个实施例中,所述根据各音频信号帧确定所述音频数据的类型还包括:响应于所述第三数量与所述音频信号帧的总数的比值小于所述第二设定阈值;确定所述音频数据的类型为不需要降噪。
在一个实施例中,所述确定所述音频数据的各音频信号帧中语音帧的信噪比,以及所述各音频信号帧中的非语音帧中含噪音段的非语音帧,具体为:将各音频信号帧输入到预先训练的语音活动检测VAD判别模型,确定各音频信号帧的帧类型,所述帧类型包括语音帧和非语音帧;响应于所述音频信号帧的帧类型为语音帧,输出所述语音帧的信噪比;响应于所述音频信号帧的帧类型为非语音帧,确定所述非语音帧中含噪音段的非语音帧。
在一个实施例中,所述VAD判别模型的训练过程包括:获取训练语料数据,其中,所述训练语料数据包括第一音频数据、所述第一音频数据对应的标识、第二音频数据以及所述第二音频数据对应的标识,所述第一音频数据为无噪音的语音数据,所述第二音频数据为在第一音频数据中增加了噪音后得到的音频数据;根据所述训练语料数据训练所述VAD判别模型。
在一个实施例中,所述信号特征包括线性预测系数特征、梅尔频率倒谱系数特征、线性预测倒谱系数特征以及Fbank特征中的任一项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大米科技有限公司,未经北京大米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011062283.4/2.html,转载请声明来源钻瓜专利网。