[发明专利]语音信号处理方法及其装置、设备、介质、产品有效
申请号: | 202111091823.6 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113823307B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 张力恒;韦军富;苏嘉昌 | 申请(专利权)人: | 广州华多网络科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;H04M9/08 |
代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 及其 装置 设备 介质 产品 | ||
1.一种语音信号处理方法,其特征在于,包括如下步骤:
持续获取通话过程中通话远端的语音帧;
根据所述语音帧相对应的远端语音能量谱数据及通话近端的噪声能量谱数据计算信噪比;
在远端语音信号的总能量不增加的前提下,区分所述信噪比高低而分别计算用于调节远端语音信号不同频点的能量的频谱增益,其中,当所述信噪比指示远端语音信号能量高于噪声信号能量时,将远端语音信号中信噪比相对较高的频点的能量,转移分配给远端语音信号中信噪比相对较低的频点;当所述信噪比指示远端语音信号能量低于噪声信号能量时,将远端语音信号中信噪比相对较低的频点的能量,转移分配给远端语音信号中信噪比相对较高的频点;
根据所述频谱增益控制远端语音信号的输出。
2.根据权利要求1所述的语音信号处理方法,其特征在于,持续获取语音通话过程中通话远端的包含语音信号的语音帧,包括如下步骤:
持续获取通话过程中通话远端的数据帧;
判断该数据帧是否为包含语音信号的语音帧;
当所述数据帧为语音帧时,根据该语音帧更新远端语音信号的语音能量谱数据;
当所述数据帧为非语音帧时,沿用当前最新的远端语音信号的语音能量谱数据。
3.根据权利要求1所述的语音信号处理方法,其特征在于,区分所述信噪比高低而分别计算用于调节远端语音信号不同频点的能量的频谱增益,包括如下步骤:
根据所述语音帧计算远端语音信号的语音能量谱数据;
从通话近端产生的近端语音信号中预估出噪声能量谱数据;
根据语音能量谱数据与噪声能量谱数据计算信噪比。
4.根据权利要求3所述的语音信号处理方法,其特征在于,从通话近端产生的近端语音信号中预估出噪声能量谱数据,包括如下步骤:
采集通话近端产生的近端语音信号;
对近端语音信号进行回声消除处理;
对近端语音信号进行噪声估计,获得噪声能量谱数据,所述噪声为近端环境噪声。
5.根据权利要求1至4中任意一项所述的语音信号处理方法,其特征在于,区分所述信噪比高低而分别计算用于调节远端语音信号不同频点的能量的频谱增益,包括如下步骤:
应用二分类函数对所述信噪比进行判断,当所述信噪比指示远端语音信号能量高于噪声信号能量时,根据第一预设公式计算频谱增益,以将远端语音信号中信噪比相对较高的频点的能量,分配给远端语音信号中信噪比相对较低的频点;当所述信噪比指示远端语音信号能量低于噪声信号能量时,根据预设第二公式计算频谱增益,以将远端语音信号中信噪比相对较低的频点的能量,分配给远端语音信号中信噪比相对较高的频点。
6.根据权利要求1至4中任意一项所述的语音信号处理方法,其特征在于,根据所述频谱增益控制远端语音信号的输出,包括如下步骤:
将所述频谱增益与所述语音帧的频域信号相乘获得新频域信号;
对所述新频域信号执行傅里叶变换运算将其变换到时域,得到增强后的远端语音信号;
输出所述远端语音信号。
7.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的步骤。
8.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至6中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111091823.6/1.html,转载请声明来源钻瓜专利网。