[发明专利]一种语音处理的方法、装置及电子设备在审
申请号: | 202011062283.4 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112053702A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 陈昌儒;包英泽 | 申请(专利权)人: | 北京大米科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/12;G10L25/24;G10L25/30;G10L25/60;G10L25/87 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋;杨春晓 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 电子设备 | ||
1.一种语音处理的方法,其特征在于,包括:
获取包括至少一个音频信号帧的音频数据;
根据各音频信号帧确定所述音频数据的类型,所述类型包括需要降噪和不需要降噪;
响应于所述音频数据的类型为需要降噪,确定所述音频数据的信号特征;
将所述信号特征输入到预先训练的降噪模型中,确定降噪后的音频数据。
2.如权利要求1所述的方法,其特征在于,所述根据各音频信号帧确定所述音频数据的类型具体包括:
确定所述音频数据的各音频信号帧中语音帧的信噪比,以及所述各音频信号帧中的非语音帧中含噪音段的非语音帧,其中,语音帧为包含非噪声信号的音频信号帧,所述非语音帧为不包含非噪声信号的音频信号帧;
确定所述信噪比小于第一设定阈值的音频信号帧的第一数量,以及所述含噪音段的非语音帧的第二数量;
根据所述第一数量和所述第二数量确定第三数量;
响应于所述第三数量与音频信号帧的总数的比值大于或等于第二设定阈值;
确定所述音频数据的类型为需要降噪。
3.如权利要求2所述的方法,其特征在于,所述根据各音频信号帧确定所述音频数据的类型还包括:
响应于所述第三数量与所述音频信号帧的总数的比值小于所述第二设定阈值;
确定所述音频数据的类型为不需要降噪。
4.如权利要求2所述的方法,其特征在于,所述确定所述音频数据的各音频信号帧中语音帧的信噪比,以及所述各音频信号帧中的非语音帧中含噪音段的非语音帧,具体为:
将各音频信号帧输入到预先训练的语音活动检测VAD判别模型,确定各音频信号帧的帧类型,所述帧类型包括语音帧和非语音帧;
响应于所述音频信号帧的帧类型为语音帧,输出所述语音帧的信噪比;
响应于所述音频信号帧的帧类型为非语音帧,确定所述非语音帧中含噪音段的非语音帧。
5.根据权利要求4所述的方法,其特征在于,所述VAD判别模型的训练过程包括:
获取训练语料数据,其中,所述训练语料数据包括第一音频数据、所述第一音频数据对应的标识、第二音频数据以及所述第二音频数据对应的标识,所述第一音频数据为无噪音的语音数据,所述第二音频数据为在第一音频数据中增加了噪音后得到的音频数据;
根据所述训练语料数据训练所述VAD判别模型。
6.如权利要求1所述的方法,其特征在于,所述信号特征包括线性预测系数特征、梅尔频率倒谱系数特征、线性预测倒谱系数特征以及Fbank特征中的任一项。
7.如权利要求1所述的方法,其特征在于,所述降噪模型的训练过程包括:
获取原始干净语音以及不同噪音类型的噪音;
根据所述原始干净语音以及所述不同噪音类型的噪音生成原始加噪语音,其中,所述原始加噪语音为不同信噪比以及不同噪音类型的噪音与所述原始干净语音的组合;
确定所述原始干净语音以及所述原始加噪语音对应的样本输入信号特征和样本输出信号特征;
通过所述样本输入信号特征和样本输出信号特征以及损失函数训练所述降噪模型。
8.如权利要求7所述的方法,其特征在于,所述通过所述样本输入信号特征和样本输出信号特征以及损失函数训练所述降噪模型,具体包括:
将所述原始干净语音以及所述原始加噪语音对应的信号特征作为所述降噪模型的输入,所述原始干净语音对应的信号特征作为所述降噪模型的输出;
根据所述损失函数训练所述降噪模型,其中,所述降噪模型为神经网络模型。
9.如权利要求7所述的方法,其特征在于,所述确定所述原始干净语音以及所述原始加噪语音对应的样本输入信号特征,具体包括:
分别提取所述原始干净语音以及所述原始加噪语音对应的至少两类样本输入信号特征;
将所述两类样本输入信号特征分别进行拼接,确定所述原始干净语音以及所述原始加噪语音对应的所述样本输入信号特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大米科技有限公司,未经北京大米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011062283.4/1.html,转载请声明来源钻瓜专利网。