[发明专利]一种基于模糊隶属函数的语音分离方法有效
申请号: | 201310206373.X | 申请日: | 2013-05-29 |
公开(公告)号: | CN103325381A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 林琳;徐鹤;孙晓颖;陈健;胡封晔;魏晓丽 | 申请(专利权)人: | 吉林大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 魏征骥 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模糊 隶属 函数 语音 分离 方法 | ||
技术领域
本发明涉及一种语音分离方法,特别是一种基于隶属函数的计算听觉场景分析语音分离方法。
背景技术
语音分离用于降低噪声对语音信号的干扰,提高目标信号的语音质量,常用于语音识别或说话人识别前端部分,提高系统识别效果。计算听觉场景分析模拟人耳听觉,有效地从混叠信号中分离出目标语音,是目前主流的语音分离方法。
中国专利CN102592607采用盲分离语音分离方法,利用子带分解和独立分量分析分离出目标语音分离出目标语音,优化了传统盲分离方法的语音分离效果,但是在非平稳噪声下其分离效果较差。中国专利CN102081928基于压缩感知和K-SVD提出一种混合语音的分离方法,该方法将语音分为男男、男女和女女三类混合语音,对每一类语音训练一个K-SVD字典,基于其稀疏结构,结合压缩感知理论,重构出各分离语音帧,并顺序连接起来,得到分离后语音信号,性能较为稳定,但对语音信号稀疏性具有一定的要求。“基于听觉场景分析的近讲语音增强算法”基于ITD、IID提出一种双麦克风的语音增强算法,在近讲场景有效消除多类噪声的影响,但其应用范围受限。“计算听觉场景分析混叠语音信号的分解”采用基音特征,对语音信号低频区高频区采用不同的分离模型,其中低频区分离模型及基音估计的精确度是影响分离效果的关键因素,在低信噪比条件下,其基音估计精度较差,导致分离后得到的语音质量偏低。
发明内容
本发明提供一种基于模糊隶属函数的语音分离方法,以解决目前分离后得到的语音质量偏低的问题。
本发明采取的技术方案是,包括下列步骤:
(一)语音信号的预处理,包括语音信号的端点检测、预加重;
(二)听觉特征提取过程如下:
(1)将预处理后得到的信号经过模拟耳蜗的伽马通滤波器处理;
1)伽马通滤波器的时域响应为
gc(t)=ti-1exp(-2πbct)cos(2πfc+φc)U(t)(1≤c≤N)
其中,N是滤波器的个数,c是滤波器的序数,按频率高低在[1,N]范围内取值,i是滤波器的阶数,U(t)是单位阶跃函数,t是时间,φc表示第c个滤波器的相位,fc是滤波器的中心频率,每个滤波器的带宽与人耳的临界频带有关,听觉心理学中的临界频带可以用等效矩形带宽来度量
EBR(f)=24.7*(4.37f/1000+1)
f为频率,bc取值为
bc=1.019EBR(fc)
2)对gc(t)进行拉普拉斯变换,得到
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310206373.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:PTFE物料的自动混料机
- 下一篇:一种粉末涂料胶化时间测定仪搅拌装置