[发明专利]基于补偿相位谱的单通道语音增强算法在审

专利信息
申请号: 202010278564.7 申请日: 2020-04-10
公开(公告)号: CN111508514A 公开(公告)日: 2020-08-07
发明(设计)人: 张晓如;许清臣;张再跃 申请(专利权)人: 江苏科技大学
主分类号: G10L21/0208 分类号: G10L21/0208;G10L21/0216;G10L21/0324
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 徐思波
地址: 212000*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 补偿 相位 通道 语音 增强 算法
【说明书】:

发明提供一种基于补偿相位谱的单通道语音增强算法,包括如下步骤:将带噪语音信号进行预处理、分帧加窗;进行傅里叶变换;使用ERB尺度划分临界频带;计算分段信噪比的值;计算新补偿因子,同时通过功率谱减法获得初次增强的语音复频谱;将相位谱补偿函数与初次增强的语音复频谱做加性计算,得到补偿后的复频谱;对补偿后的复频谱求取相位角,得到补偿相位谱;通过将基本谱减后的语音幅度谱与步骤七得到的补偿相位谱重叠相加后再进行逆傅里叶变换,得到增强后语音信号。本发明验证了改进的补偿因子不仅对稳态噪声有作用,还对非稳态噪声的去噪效果更加有利,本发明语音增强算法的适用噪声环境较为广泛且有效。

技术领域

本发明涉及语音增强算法领域,具体涉及一种基于补偿相位谱的单通道语 音增强算法。

背景技术

传统的相位谱补偿语音增强算法,假设纯净语音s(t)受到平稳加性高斯噪 声d(t)的污染,而且两者相互独立,则带噪语音x(t)的时域表示为:

x(t)=s(t)+d(t) (1);

对式(1)做短时傅里叶变换得到频域的表达式为:

其中,n为帧数,N表示离散傅里叶变换长度,k表示频带数,w(n)是窗 函数;j是傅里叶变换的定义中数学符号,一般不需要说明解释。

为了方便表示带噪语音,使用极坐标的形式表示式(2):

X(n,k)=|X(n,k)|ej∠X(n,k) (3);

式中,|X(n,k)|为带噪语音信号的幅度谱,∠X(n,k)是相位谱。

在传统的相位谱补偿算法中,定位相位谱补偿函数为:

式(4)中,λ是补偿因子,现有技术中的补偿因子根据大量实验得出的 经验常数值为3.74;是对带噪语音的前几帧的噪声估计值;为一个 判决函数,它的表达式为:

然后将相位谱补偿函数与带噪语音信号的频谱相加,得到一个补偿后的频 谱表达式:

XΛ(n,k)=X(n,k)+Λ(n,k) (6)。

对补偿后的频谱求取相位角,得到补偿相位谱:

其中,Im{·}和Re{·}分别是对XΛ(n,k)求虚部和实部。

最后将带噪语音的幅度谱与补偿的相位谱相结合,得到增强的语音频谱如 下:

由于语音信号是实信号,其经过短时傅里叶变换后得到的是一对共轭对称 的向量,其中,幅度谱是对称的,相位谱是反对称的,最后在语音合成过程中 的逆短时傅里叶变换是将共轭项相加形成实信号的反过程。

在传统的语音增强算法中,通常是保留带噪音相位谱,将其与处理后的语 音幅度谱相结合。而且传统相位谱补偿算法中的补偿因子是一个根据实验所得 到的的经验固定常数值3.74,这无法对带噪语音的相位谱进行灵活补偿,对于 带噪语音来说,背景噪声是在不断变化的,如果采用一个固定的补偿因子进行 相位谱补偿就不能够得到符合不断变化的相位谱,从而会导致合成语音相位谱 中的细节信息不准确,增强后的语音质量不高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010278564.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top