[发明专利]基于抖动失真的语音频客观质量评价方法及系统有效
申请号: | 201310033963.7 | 申请日: | 2013-01-29 |
公开(公告)号: | CN103050128A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 胡瑞敏;杨玉红;余洪江;谢松波;董少龙;张聪;高丽;李登实;涂卫平;王晓晨 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张火春 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 抖动 失真 语音 客观 质量 评价 方法 系统 | ||
技术领域
本发明涉及语音频质量客观评价领域,尤其涉及一种基于抖动失真的语音频客观质量评价方法及系统。
背景技术
随着移动通信设备的不断发展和广泛普及,移动语音频的应用变得更加方便和频繁。在移动通信中,语音频编解码器要求采用计算复杂度低、码率低并且高质量的语音频编码算法,而传统的语音频客观质量评价方法并不适用于测试中低码率语音频序列。同时移动通信网络具有不稳定性等干扰因素,传统语音频客观质量评价方法未考虑通信网络参数对语音频质量造成的影响。基于以上两点不足,传统语音频客观质量评价方法应用于移动语音频序列时,其评价结果与真实主观听觉感受存在较大差异。
发明内容
本发明的目的是提供一种基于抖动失真的语音频质量评价方法及系统,可对移动语音频客观质量进行更精确的评价。
为达到上述目的,本发明提供一种基于抖动失真的语音频客观质量评价方法。
在移动通信环境中,语音频信号经发送端编码,通过传输网络传送至接收端,发送端和接收端的语音频信号分别记为原始信号与测试信号。本发明方法包括以下步骤:
步骤1,将原始信号和测试信号的时域信号转换为频域信号;可采用短傅里叶法进行时频转换;
步骤2,根据频域信号分别获得原始信号和测试信号的底层声学特征参数,基于原始信号和测试信号的底层声学特征参数获得测试信号的底层声学特征参数失真测度值;
步骤3,根据原始信号和测试信号的频域信号获得测试信号总体失真,获取总体失真超过设定阈值的测试信号,并基于总体失真超过阈值的测试信号获取测试信号的抖动失真参数;
步骤4,根据原始信号和测试信号的频域信号获取信号的能量均衡参数;
步骤5,融合所得底层声学特征参数失真测度值、抖动失真参数和能量均衡参数,得到测试信号的语音频客观质量评价分数。
步骤1中采用短傅里叶法进行时频转换。
上述底层声学特征参数失真测度值其中,Dp为测试信号第i个底层声学特征参数的失真测度值,xp、yp分别为原始信号和测试信号的第p个底层声学特征参数值,p为底层声学特征参数编号。
步骤3进一步包括子步骤:
步骤301,对原始信号和测试信号的频域信号分别进行加窗,获得加窗后的原始信号和测试信号的频域信号间的误差信号:其中,k为信号的帧数索引,为加窗后原始信号的第k帧频域信号,Xt[k]为加窗后测试信号的第k帧频域信号,Xerrror[k]为第k帧原始信号和测试信号窗信号的误差信号;
步骤302,获取原始信号和测试信号的窗信号的均方差:σ2[k]=(XerorT[k]·Xeror[k])/M,其中,σ2[k]为第k帧原始信号和测试信号窗信号的均方差,Xerrror[k]为第k帧原始信号和测试信号窗信号的误差信号;XerrorT[k]为Xerrror[k]的倒置矩阵;M为窗长度;
步骤303,基于原始信号和测试信号的窗信号的均方差获取测试信号的总体失真其中,N(k,l)为连续丢包数为l时、测试信号的第k帧信号的总体失真;l为连续丢包数目;σ2[k+i]为第(k+i)帧原始信号和测试信号窗信号的均方差;
步骤304,寻找测试信号中总体失真N(k,l)大于阈值NThres的区域(K,L):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310033963.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分体式抗电磁干扰金属过桥弯
- 下一篇:输电线路带电作业异物清除剪