[发明专利]采用感知模型的语音增强有效
申请号: | 200880008865.5 | 申请日: | 2008-03-14 |
公开(公告)号: | CN101636648A | 公开(公告)日: | 2010-01-27 |
发明(设计)人: | 俞容山 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G01L21/02 | 分类号: | G01L21/02 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 魏小薇 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采用 感知 模型 语音 增强 | ||
1.一种用于增强由语音分量和噪声分量构成的音频信号的语音分 量的方法,包括:
将所述音频信号从时域变换为频域中的多个子带,
处理所述音频信号的子带,所述处理包含响应控制而自适应地降 低所述子带中的一些子带的增益,其中,至少部分地从所述子带中的 所述一些子带中的音频信号的噪声分量的幅度的估计得出所述控制, 并且其中,所述增益使代价函数最小化,所述代价函数包含语音畸变 项和可感知噪声项,其中所述语音畸变项与所述可感知噪声项的相对 重要性由加权因子确定,所述语音畸变项是从施加增益前后的语音分 量幅度的log之间的差值得到的,所述可感知噪声项是从掩蔽阈值的 log和施加增益之后的估计的噪声分量幅度的log之间的差值得到的, 和
将处理后的音频信号从频域变换成时域以提供语音分量被增强的 音频信号。
2.根据权利要求1的方法,其中,还至少部分地从通过对心理声 学掩蔽模型应用所述音频信号的语音分量的幅度的估计得到的所述子 带中的所述一些子带中的每一个子带中的掩蔽阈值得出所述控制。
3.根据权利要求2的方法,其中,当子带中的噪声分量的幅度的 所述估计高于所述子带中的所述掩蔽阈值时,所述控制使得降低所述 子带的增益。
4.根据权利要求3的方法,其中,所述控制使得降低子带的增益, 使得施加增益改变之后的噪声分量的幅度的估计等于或低于所述子带 中的掩蔽阈值。
5.根据权利要求3或4的方法,其中,响应所述加权因子,减小 增益降低的量,其中所述加权因子能够使语音畸变的程度与可感知噪 声的程度平衡。
6.根据权利要求5的方法,其中,所述加权因子是可选择的设计 参数。
7.根据权利要求1~4中的任一项的方法,其中,音频信号的语音 分量的幅度的估计已被应用于将语音分量的能量分布于相邻频率子带 的扩展函数。
8.根据权利要求5的方法,其中,音频信号的语音分量的幅度的 估计已被应用于将语音分量的能量分布于相邻频率子带的扩展函数。
9.根据权利要求6的方法,其中,音频信号的语音分量的幅度的 估计已被应用于将语音分量的能量分布于相邻频率子带的扩展函数。
10.一种用于增强由语音分量和噪声分量构成的音频信号的语音 分量的设备,包括:
用于将所述音频信号从时域变换为频域中的多个子带的装置,
用于处理所述音频信号的子带的装置,所述处理包含响应控制而 自适应地降低所述子带中的一些子带的增益,其中,至少部分地从所 述子带中的所述一些子带中的音频信号的噪声分量的幅度的估计得出 所述控制,并且其中,所述增益使代价函数最小化,所述代价函数包 含语音畸变项和可感知噪声项,其中所述语音畸变项与所述可感知噪 声项的相对重要性由加权因子确定,所述语音畸变项是从施加增益前 后的语音分量幅度的log之间的差值得到的,所述可感知噪声项是从 掩蔽阈值的log和施加增益之后的估计的噪声分量幅度的log之间的 差值得到的,和
用于将处理后的音频信号从频域变换成时域以提供语音分量被增 强的音频信号的装置。
11.根据权利要求10的设备,其中,还至少部分地从通过对心理 声学掩蔽模型应用所述音频信号的语音分量的幅度的估计得到的所述 子带中的所述一些子带中的每一个子带中的掩蔽阈值得出所述控制。
12.根据权利要求11的设备,其中,当子带中的噪声分量的幅度 的所述估计高于所述子带中的所述掩蔽阈值时,所述控制使得降低所 述子带的增益。
13.根据权利要求12的设备,其中,所述控制使得降低子带的增 益,使得施加增益改变之后的噪声分量的幅度的估计等于或低于所述 子带中的掩蔽阈值。
14.根据权利要求12或13的设备,其中,响应所述加权因子, 减小增益降低的量,其中所述加权因子能够使语音畸变的程度与可感 知噪声的程度平衡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880008865.5/1.html,转载请声明来源钻瓜专利网。