[发明专利]一种针对VoIP语音的客观评测方法无效
申请号: | 200910235644.8 | 申请日: | 2009-10-10 |
公开(公告)号: | CN102044247A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 杨越;谢湘;魏耀都 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/12;H04M7/00 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 张利萍;高燕燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 voip 语音 客观 评测 方法 | ||
1.一种针对VoIP语音的客观评测方法,其特征在于:包括如下步骤:
第一步:在VoIP的发送端获得原始语音;
第二步:在接收端获得引入损伤的失真语音;
第三步:通过预处理模块划分原始语音和失真语音,得到语句信息,并且判断失真语音中是否有拉伸或压缩语句,得到拉伸或压缩信息;
第四步:利用编解码器损伤评估模块A计算对齐语句的编解码器损伤,利用编解码器损伤评估模块B计算有拉伸或压缩的语句的质量损伤,利用延时损伤评估模块评测端到端延时和内部的延时对语音的影响;
第五步:利用拟合模块最终得到语音质量客观评测分值。
2.根据权利要求1所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的发送端和接收端为固定电话、移动电话或者IP终端计算机。
3.根据权利要求1所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的预处理语句间过大的延时的方法是:计算原始语音和失真语音一段间隔内的能量值,根据各自的能量值划分原始语音和失真语音,得到语句信息;根据原始语音以及失真语音的语句信息,计算出语句间的延时,根据定义的最大延时阈值以及原始语音语句间的延时值,处理VoIP失真语音语句间过大的延时,并且将语句信息存储下来,原始语句信息继续用于延时评估模块的计算。
4.根据权利要求1或3所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的语句包含至少300ms的连续活动语音,并且包含的静音期不超过200ms,语句间的界限处于语句间隔的静默期中间。
5.根据权利要求1或2或3所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的利用编解码器损伤评估模块A计算对齐语句的编解码器损伤的方法为:对原始语音与失真语音中未有拉伸或压缩的部分,采用感知语音质量评价PESQ的听觉变换、扰动处理以及感知模型来评价其编解码器的损伤,得到编解码器损伤评估模块1的评测分值。
6.根据权利要求1或2或3所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的利用编解码器损伤评估模块2计算对齐语句的编解码器损伤的方法为:采用基于美尔倒谱系数MFCC的动态弯折DTW方法计算最佳路径对应的最小代价来评测未对齐语音的距离。
7.根据权利要求1所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的延时损伤评估模块评测端到端延时和内部延时对语音的影响的方法为:根据存储的原始语音和失真语音的语句信息,利用基于FFT的互相关进行包络对齐,计算出原始语音和失真语音开头的延时,以及中间每一段语句的延时值和存在的位置。
8.根据权利要求1或7所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的延时损伤评估模块评测端到端延时和内部延时对语音的影响方法还包括:将延时值和存在的位置保存在一个2维数组中,然后根据大量的主观分值的训练,得出各个位置以及延时值大小对语音损伤的影响的映射关系,由延时损伤评估模块得到客观分值。
9.根据权利要求1所述的一种针对VoIP语音的客观评测方法,其特征在于:所述PESQ计算采用下述步骤:
第一步:调整原始信号和失真信号到标准听觉电平;
第二步:用输入滤波器模拟标准听觉电话筒进行滤波;
第三步:对通过电平调整和滤波后的两个信号在时间上对齐;
第四步:行听觉变换,包括对系统中线性滤波和增益变换的补偿和均衡;
第五步:以听觉变换后的两个信号之间的不同作为扰动,分析扰动曲面,提取出两个失真参数,在频率和时间上进行累积,映射到主观意见分的预测值。
10.根据权利要求9所述的一种针对VoIP语音的客观评测方法,其特征在于:所述的时间对齐算法包括如下步骤:
第一步:基于参考信号和失真信号整体包络的粗略延时估计;
第二步:以参考信号的信息来划分语句;
第三步:对每一语句进行基于包络的粗略延时估计;
第四步:对每一语句进行基于帧到帧的加权直方图精细延迟估计;
第五步:重新对齐划分出来的新语句,直到延时在一个语句内没有变化;
第六步:在感知模型后,根据干扰度识别和定义出坏区间,再重新返回对齐模块进行调整对齐;
第七步:将所述的编解码器损伤评估模块1的客观分值,编解码器损伤评估模块2的客观分值以及延时损伤评估模块得到的客观分值通过拟合模块,得到最终的VoIP语音的客观评测分值的拟合公式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910235644.8/1.html,转载请声明来源钻瓜专利网。