[发明专利]一种基于听觉感知特性的语音质量客观评价方法无效
申请号: | 201210332288.3 | 申请日: | 2012-09-11 |
公开(公告)号: | CN102881289A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 谭晓衡;秦基伟;周帅;裴婧;黄振林;唐永刚;马旭东 | 申请(专利权)人: | 重庆大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400044 重庆市沙坪坝*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种简单有效的基于听觉感知特性的语音质量客观评价方法,根据心理声学原理将人耳听觉模型和非线性压缩变换引入MFCC(Mel频率倒谱系数)特征参数的提取过程。本发明使用Gammatone滤波器组对耳蜗基底膜进行仿真,在幅值非线性变换过程中用立方根非线性压缩变换来模拟语音的强度-响度感知特性。使用新的特征参数,提出了一种更加符合人耳听觉感知特性的语音质量评价方法。与其它方法相比,本发明有效地提高了客观评价结果与主观评价结果的相关度,运行时间较短且复杂度低,具有较强的适应性,可靠性和实用性。本发明通过模拟人耳的听觉感知特性来进行语音质量评价的方法可为改善语音质量客观评价提供新的解决思路。 | ||
搜索关键词: | 一种 基于 听觉 感知 特性 语音 质量 客观 评价 方法 | ||
【主权项】:
1.一种简单有效的基于听觉感知特性的语音质量客观评价技术,根据心理声学原理将人耳听觉模型和非线性压缩变换引入特征参数的提取过程来进行语音质量的客观评价,其特征在于采用以下步骤:A、将原始语音和通过被测系统的失真语音进行预处理,以便于提取各自的特征参数;B、对经过预处理的语音信号进行加汉宁窗的FFT变换,得到第k帧信号频谱;C、采用Mel频率尺度来模拟人耳对声音频率的感知特性,Mel频率与实际频率的具体关系为:;D、通过一组Mel尺度的Gammatone滤波器组,在频域对能量谱进行滤波,得到每个Gammatone滤波器的输出能量,计算过程由式给出:;E、采用立方根变换来模拟强度-响度的非线性压缩关系:;F、用RASTA滤波器对语音信号进行滤波,抑制信号频谱中的常量或变化缓慢的非语音部分,增强动态成分,RASTA滤波器的表达式为:;G、立方根能量经过RASTA滤波和DCT变换到倒谱域,即可得到新的特征参数,计算过程由式给出:;H、计算两路信号特征参数的平均动态Mel倒谱距离D,将D值进行二次多项式变换来预测主观MOS分,通过预测值的大小来判断被测系统语音质量的好坏。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210332288.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种木材再生方法
- 下一篇:由不饱和脂肪酸酯合成环氧脂肪酸酯的方法