[发明专利]基于语音增强算法主观评估的客观评估方法无效
申请号: | 200910181541.8 | 申请日: | 2009-07-28 |
公开(公告)号: | CN101609686A | 公开(公告)日: | 2009-12-23 |
发明(设计)人: | 周璐;邱小军;林志斌 | 申请(专利权)人: | 南京大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 增强 算法 主观 评估 客观 方法 | ||
一、技术领域
本发明涉及一种测量语音增强的客观评估方法,尤其是涉及一种利用多元线性回归分析提出的客观组合方法。该方法主客观相关系数较高、误差的标准差更低,能更准确评估语音增强算法性能优劣。
二、背景技术
语音增强是从噪声背景中提取有用的语音信号,抑制或降低噪声干扰的技术。由于人是语音的最终接受者,所以主观评价才是语音质量的真实反映,也是最可靠的评价语音增强效果的方法。但在低信噪比的情况下,语音增强算法在抑制背景噪声的过程中可能对语音信号产生劣化作用。ITU-T P.835引导试听者单独对语音信号评分(SIG)、单独对背景噪声评分(BAK)和整体效果评分(OVL),三方面共同作为语音增强效果的主观评估。但主观评测方法耗费大量人力、物力和时间,因此采用客观测试方法来评价语音增强效果。通常采用主客观相关系数和主客观评分误差的标准差两个统计参数评估客观方法的性能。
现有的几种常用客观测试方法为:感知评估通话质量(PESQ),ITU-T P.862中详细描述了PESQ这种窄带电话网络和语音编解码器端到端语音质量客观评价方法,用数字信号处理的方式比较参考信号和劣化信号,估算得到的语音质量评分范围为[-0.5,4.5]。对数似然率(LLR)是一种增益归一化的度量参考语音和劣化语音之间距离的方法,度量所得两种谱之间的失真大小只与谱的形状有关,而与其能量大小无关,估算得到的LLR值范围为[0,2]。倒谱(CEP)是语音信号的又一特征,这里采用基于线性预测分析的倒谱系数作为语音的特征参数,语音信号所携带的语义信息主要体现在声道传输函数上,通过参考语音和劣化语音的倒谱距离可以估算语音质量,CEP值为[0,10]。分段信噪比(SNRseg)建立在度量均方误差基础上,SNRseg是基于帧的信噪比,是每一帧语音信号信噪比的均值。频率分段信噪比(fwSNRseg)是将SNRseg扩展到频域上得到的,取值范围为[-10dB,35dB]。通过回归分析得到每个频段的权重确保主客观相关系数最大,组成了变频率分段信噪比(fwSNRsegVar)方法,取值范围[-10dB,35dB]。
这些常用客观测试方法的主客观相关系数和误差的标准差见表1,表中括号内的数为误差的标准差(P.C.Loizou,Speech Enhancement:Theory and Practice,CRC Press,2007)。从表1可以看出,目前传统的客观测试方法在单独对背景噪声评分方面主客观相关系数普遍较低,误差的标准差在单独对语音信号评分、单独对背景噪声评分和整体效果评分三方面都过高,同时并没有给出如何使用客观测试方法对各语音增强算法性能优劣的评估。
表1几种客观测量方法主客观相关系数和误差的标准差(括号内的数)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910181541.8/2.html,转载请声明来源钻瓜专利网。