[发明专利]一种室内混响消除的方法有效
申请号: | 201310317200.5 | 申请日: | 2013-07-23 |
公开(公告)号: | CN103413547A | 公开(公告)日: | 2013-11-27 |
发明(设计)人: | 陈喆;殷福亮;彭雯雯 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G10K11/16 | 分类号: | G10K11/16;G10K15/08 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 曲永祚;李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 室内 混响 消除 方法 | ||
1.一种室内混响消除的方法,其特征在于:包括后期混响功率谱估计模块,谱减模块,有音/无音检测模块,能量衰减模块以及自适应谱线增强模块;所述的后期混响功率谱估计模块输入为混响语音,输出与谱减模块连接;谱减模块的输入为混响语音和后期混响功率谱估计模块的输出,输出与有音/无音检测模块相连;有音/无音检测模块输出控制谱减模块的输出选择可连接能量衰减模块或连接自适应谱线增强模块;能量衰减模块和自适应谱线增强模块输出最终的增强后的语音。
2.根据权利要求1所述的一种室内混响消除的方法,其特征在于:所述后期混响功率谱估计模块的方法如下:
后期混响功率谱估计模块的输入为混响语音即语音含有混响成分,通过此混响语音估计出混响能量比以及混响语音功率谱,根据混响能量比和混响语音功率谱之间的映射关系,得到后期混响功率谱;
对输入采样频率为fs=16kHz的混响语音x(n),采用重叠分帧方式进行分帧,重叠约75%;分帧用窗函数为汉明窗w(n)=0.54-0.46cos[(2n+1)π/N],n=0,1,…,N-1;对第l帧混响语音x(l,n)进行加窗处理,加窗后的语音为xw(l,n)=x(l,n)·w(n),n=0,1,…,N-1;用离散傅里叶变换将加窗后的混响语音变换到频域,X(l,k)表示第l帧混响语音频谱,
混响语音功率谱的估算公式为
其中,N为语音帧长度包含采样点的数目和窗口长度,N取值512,平滑系数ηx与平均衰减系数有关,具体关系如下
其中,e为自然对数的底数,R为帧率,即每秒语音数据中语音帧的数量,设置R=128,RT60是混响时间,是描述室内声音衰减快慢程度的客观物理参数,它是指声源在扩散声场中停止发声后,残余的声能经过往返反射,声能量衰减60dB所需的时间,即相当于平均声能密度降为原来的10-6所需的时间,RT60可使用Sabine公式近似估算出来;
定义混响分量的功率谱、后期混响分量的功率谱分别为
其中,Tl为前期混响到达的时间,设置Tl=32ms;Tr=R/fs,表示直达信号到达的时间,Tr≤Tl<<RT60;参数κ与混响能量比有关,用来防止后期混响的过估计;采用自适应方法估计参数κ;当|X(l,k)|2<λx(l,k)时,减小参数κ的值;当|X(l,k)|2>λx(l,k)时,增大参数κ的值;当|X(l,k)|2=λx(l,k)时,参数κ不变;参数κ在第l帧计算方法为
其中,0<μ<1,表示更新步长,设置μ=0.01,参数κ的初始值κ(0)设置为κ(0)=0.01。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310317200.5/1.html,转载请声明来源钻瓜专利网。