[发明专利]语音降噪方法和装置在审
申请号: | 202010322987.4 | 申请日: | 2020-04-22 |
公开(公告)号: | CN113539290A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 廖猛;范泛;陈伟宾;吴超 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232;G10K11/178;G10L15/20;G10L17/20;G10L25/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王洪 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 方法 装置 | ||
1.一种语音降噪方法,其特征在于,包括:
获取M个第一语音频谱信号,所述M个第一语音频谱信号是通过N个麦克风对用户的第一语音进行采集得到的,M和N均为大于1的整数,且N大于或等于M;
对所述M个第一语音频谱信号进行第一滤波降噪处理,得到M个第一降噪信号;
根据所述M个第一降噪信号中的每个第一降噪信号,确定第一掩码信息,所述第一掩码信息用于表示所述每个第一降噪信号中包括的多个频点中的每个频点属于第一目标频点的概率值,所述第一目标频点包括预设的第一目标语音的频谱信号中包括的频点;
根据所述第一掩码信息,对所述M个第一语音频谱信号进行第二滤波降噪处理,得到M个第二降噪信号,所述M个第二降噪信号用于识别所述第一语音中是否包含所述第一目标语音。
2.根据权利要求1所述的方法,其特征在于,所述根据所述M个第一降噪信号中的每个第一降噪信号,确定第一掩码信息,包括:
将所述M个第一降噪信号中的每个第一降噪信号的频谱特征信息输入第一神经网络模型,得到所述第一掩码信息,所述每个第一降噪信号的频谱特征信息用于表示所述每个第一降噪信号的频谱分布特征,其中,所述第一神经网络模型是根据第一训练数据样本集训练得到的,所述第一训练数据样本集中包括至少一个第一样本数据组,所述至少一个第一样本数据组中的每个第一样本数据组包括第一样本语音频谱信号的频谱特征信息和与所述第一样本语音频谱信号对应的第二样本语音频谱信号的频谱特征信息,所述第一样本语音频谱信号包括所述第一目标语音,所述第二样本语音频谱信号包括所述第一样本语音频谱信号和噪声。
3.根据权利要求1或2所述的方法,其特征在于,当M大于N时,所述获取M个第一语音频谱信号,包括:
接收所述N个麦克风对所述第一语音进行采集得到的N个第二语音信号,所述N个麦克风与所述N个第二语音信号一一对应;
对所述N个第二语音信号进行频域转换,得到N个第二语音频谱信号;
对所述N个第二语音频谱信号进行第一处理,得到所述M个第一语音频谱信号,其中,所述第一处理包括波达方向处理或波束成形处理。
4.根据权利要求1或2所述的方法,其特征在于,当M等于N时,所述获取M个第一语音频谱信号,包括:
接收所述N个麦克风对所述第一语音进行采集得到的N个第一语音信号,所述N个麦克风与所述N个第一语音信号一一对应;
对所述N个第一语音信号进行频域转换,得到所述M个第一语音频谱信号。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
根据所述M个第二降噪信号对所述第一语音进行语音识别,以确定所述第一语音中是否包含所述第一目标语音。
6.根据权利要求5所述的方法,其特征在于,当确定所述第一语音中包含所述第一目标语音时,所述方法还包括:
获取M个第三语音频谱信号,所述M个第三语音频谱信号是通过所述N个麦克风对所述用户的第二语音进行采集得到的;
根据所述第二滤波降噪处理所使用的滤波系数,对所述M个第三语音频谱信号进行第三滤波降噪处理,得到M个第三降噪信号;
根据M个第二目标降噪信号,对所述M个第三降噪信号进行降噪,得到第四降噪信号,所述第四降噪信号用于识别所述第二语音中是否包含预设的第二目标语音,所述M个第二目标降噪信号为所述M个第二降噪信号中与所述第一目标语音对应的部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010322987.4/1.html,转载请声明来源钻瓜专利网。