[发明专利]一种基于模糊隶属函数的语音分离方法有效

申请号：	201310206373.X	申请日：	2013-05-29
公开（公告）号：	CN103325381A	公开（公告）日：	2013-09-25
发明（设计）人：	林琳;徐鹤;孙晓颖;陈健;胡封晔;魏晓丽	申请（专利权）人：	吉林大学
主分类号：	G10L21/0272	分类号：	G10L21/0272
代理公司：	吉林长春新纪元专利代理有限责任公司 22100	代理人：	魏征骥
地址：	130012 吉***	国省代码：	吉林;22
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于模糊隶属函数语音分离方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种语音分离方法，特别是一种基于隶属函数的计算听觉场景分析语音分离方法。

背景技术

语音分离用于降低噪声对语音信号的干扰，提高目标信号的语音质量，常用于语音识别或说话人识别前端部分，提高系统识别效果。计算听觉场景分析模拟人耳听觉，有效地从混叠信号中分离出目标语音，是目前主流的语音分离方法。

中国专利CN102592607采用盲分离语音分离方法，利用子带分解和独立分量分析分离出目标语音分离出目标语音，优化了传统盲分离方法的语音分离效果，但是在非平稳噪声下其分离效果较差。中国专利CN102081928基于压缩感知和K-SVD提出一种混合语音的分离方法，该方法将语音分为男男、男女和女女三类混合语音，对每一类语音训练一个K-SVD字典，基于其稀疏结构，结合压缩感知理论，重构出各分离语音帧，并顺序连接起来，得到分离后语音信号，性能较为稳定，但对语音信号稀疏性具有一定的要求。“基于听觉场景分析的近讲语音增强算法”基于ITD、IID提出一种双麦克风的语音增强算法，在近讲场景有效消除多类噪声的影响，但其应用范围受限。“计算听觉场景分析混叠语音信号的分解”采用基音特征，对语音信号低频区高频区采用不同的分离模型，其中低频区分离模型及基音估计的精确度是影响分离效果的关键因素，在低信噪比条件下，其基音估计精度较差，导致分离后得到的语音质量偏低。

发明内容

本发明提供一种基于模糊隶属函数的语音分离方法，以解决目前分离后得到的语音质量偏低的问题。

本发明采取的技术方案是，包括下列步骤：

（一）语音信号的预处理，包括语音信号的端点检测、预加重；

（二）听觉特征提取过程如下：

（1）将预处理后得到的信号经过模拟耳蜗的伽马通滤波器处理；

1）伽马通滤波器的时域响应为

g_c(t)＝t^i-1exp(-2πb_ct)cos(2πf_c+φ_c)U(t)(1≤c≤N)

其中，N是滤波器的个数，c是滤波器的序数，按频率高低在[1,N]范围内取值，i是滤波器的阶数，U(t)是单位阶跃函数，t是时间，φ_c表示第c个滤波器的相位，f_c是滤波器的中心频率，每个滤波器的带宽与人耳的临界频带有关，听觉心理学中的临界频带可以用等效矩形带宽来度量

EBR(f)＝24.7*(4.37f/1000+1)

f为频率，b_c取值为

b_c＝1.019EBR(f_c)