[发明专利]一种残余回声及噪声消除方法及装置有效
申请号: | 202110008502.9 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112863535B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 李军锋;顾建军;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0208 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 残余 回声 噪声 消除 方法 装置 | ||
1.一种残余回声及噪声消除方法,其特征在于,包括:
接收含有回声及噪声的语音时域信号和远端参考声时域信号;
对所述含有回声及噪声的语音时域信号和所述远端参考声时域信号分别进行分帧、加窗和傅里叶变换,得到含有回声及噪声的语音频域信号和远端参考声频域信号;
根据所述含有回声及噪声的语音频域信号和所述远端参考声频域信号,确定回声频域信号;
根据所述含有回声及噪声的语音频域信号和所述回声频域信号,确定含有残余回声及噪声的语音频域信号;
将所述含有残余回声及噪声的语音频域信号的幅度谱、所述回声频域信号的幅度谱和所述远端参考声频域信号的幅度谱进行能量归一化处理,得到含有残余回声及噪声的语音频域信号特征、回声频域信号特征和远端参考声频域信号特征;
将所述含有残余回声及噪声的语音频域信号特征与所述远端参考声频域信号特征进行拼接,得到第一拼接结果,并且将所述含有残余回声及噪声的语音频域信号特征与所述回声频域信号特征进行拼接,得到第二拼接结果;
将所述第一拼接结果和所述第二拼接结果输入训练后级联网络中的训练后特征注意力模型,获得与所述远端参考声频域信号特征对应的第一注意力权重和与所述回声频域信号特征对应的第二注意力权重;
将所述远端参考声频域信号特征与第一注意力权重相乘,得到第一融合注意力机制特征,并且将所述回声频域信号特征与第二注意力权重相乘,得到第二融合注意力机制特征;
将所述第一融合注意力机制特征、所述第二融合注意力机制特征和所述含有残余回声及噪声的语音频域信号特征进行拼接,得到第一融合拼接结果;
将所述第一融合拼接结果输入所述训练后级联网络中的训练后残余回声及噪声消除模型,得到目标语音频域信号的掩蔽估计值;
根据所述目标语音频域信号的掩蔽估计值和所述含有残余回声及噪声的语音频域信号,得到所述目标语音频域信号;
对所述目标语音频域信号进行逆傅里叶变换,得到目标语音时域信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述含有回声及噪声的语音时域信号和所述远端参考声时域信号分别进行分帧、加窗和傅里叶变换,包括:
对所述含有回声及噪声的语音时域信号和所述远端参考声时域信号分别取预设个数采样点作为一帧信号;若长度不足则先补零到预设个数;
对每一帧信号进行加窗;其中,加窗函数采用汉明窗;
对加窗后的每一帧信号进行傅里叶变换。
3.根据权利要求1所述的方法,其特征在于,所述根据所述含有回声及噪声的语音频域信号和所述远端参考声频域信号,确定回声频域信号,包括:
将所述含有回声及噪声的语音频域信号和所述远端参考声频域信号输入卡尔曼滤波器,得到滤波器系数和所述回声频域信号;
所述回声频域信号为所述滤波器系数和所述远端参考声频域信号相乘的结果。
4.根据权利要求1所述的方法,其特征在于,所述根据所述含有回声及噪声的语音频域信号和所述回声频域信号,确定含有残余回声及噪声的语音频域信号,包括:
所述含有回声及噪声的语音频域信号减去所述回声频域信号,得到所述含有残余回声及噪声的语音频域信号。
5.根据权利要求1所述的方法,其特征在于,所述将所述含有残余回声及噪声的语音频域信号的幅度谱、所述回声频域信号的幅度谱和所述远端参考声频域信号的幅度谱进行能量归一化处理,得到含有残余回声及噪声的语音频域信号特征、回声频域信号特征和远端参考声频域信号特征,包括:
根据所述含有残余回声及噪声的语音频域信号的幅度谱、所述回声频域信号的幅度谱和所述远端参考声频域信号的幅度谱,分别确定与其对应的第一函数、第二函数和第三函数;
根据与所述含有残余回声及噪声的语音频域信号的幅度谱对应的第一函数、所述含有残余回声及噪声的语音频域信号特征的均值及方差,确定所述含有残余回声及噪声的语音频域信号特征;
根据所述回声频域信号的幅度谱对应的第二函数、所述回声频域信号特征的均值及方差,确定所述回声频域信号特征;
根据所述远端参考声频域信号的幅度谱对应的第三函数、所述远端参考声频域信号特征的均值及方差,确定所述远端参考声频域信号特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110008502.9/1.html,转载请声明来源钻瓜专利网。