[发明专利]一种针对流媒体音频质量的客观评测方法无效

申请号：	200910235645.2	申请日：	2009-10-10
公开（公告）号：	CN102044248A	公开（公告）日：	2011-05-04
发明（设计）人：	杨越;谢湘;魏耀都	申请（专利权）人：	北京理工大学
主分类号：	G10L19/00	分类号：	G10L19/00
代理公司：	北京理工大学专利中心 11120	代理人：	张利萍;高燕燕
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种针对流媒体音频质量客观评测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信网络质量的评测方法，尤其是对于流媒体音频质量的一种客观评测方法。

背景技术

21世纪是网络高速发展的时代，随着互联网的普及，利用网络传输音频信号的需求也越来越大。流媒体技术的出现，在一定程度上使互联网传输音频难的局面得到改善，其将过去传统媒体的“推”式传播，变为受众的“拉”式传播与实时传播。由于流媒体技术在一定程度上突破了网络带宽对多媒体信息传输的限制，因此被广泛运用于网上直播、网络会议、远程教育及企业培训等多种领域。为了更好的进行流媒体的传输，通常需要对于流媒体质量进行评测，同时也对流媒体音频的质量评测提出了新的挑战。

目前对于语音及音频质量的测试方法有两种：传统的主观评测方法和评测的新方法客观评测。主观评价是以人为主体来评价语音和音频的质量。在语音质量主观评价方法中，MOS评分用的最为广泛，它以平均意见分来衡量语音质量，用五个等级来表示语音的质量等级：优(5分)、良(4分)、一般(3分)、差(2分)、坏(1分)。主观听音测试方法包括：ACR：绝对等级评定，最常用的一种听音测试方法，等级评定是基于语句组的，语句组有一组无关的短句组成，每一个语句都通过一系列的标准处理。DCR：衰减等级评定，用于小衰减情况，适于评价类似的数字语音处理算法、系统优化。CCR：比较等级评定，用于改进输入语音质量，如加噪等。在音频方面，按照音频信号编、解码后质量的高低，可将音频信号的质量评价分成两类：一种为对小损伤、高质量音频信号一般采用ITU-R BS.1116标准进行测试；另一种为对中等损伤、中等质量的音频信号一般采用ITU-R BS.1534(MUSHRA)，它是一种双盲的多激励音频信号听音比较测试方法，双盲指的是在待评测的语句中含有隐含的参考信号(通常为原始的高质量音频)和隐含的失真信号(称之为锚)。其评分等级范围为0到100，分值步进为1，每20分对应一个质量等级，分别对应质量级别的“极差”到“优异”，听音人员对待测音频信号进行评分比较排序，并可以任意选择听音顺序和听音次数。这个测试方法是一种多激励的对比听音测试，能够有效的区分出待测信号的质量等级。主观评价的优点是符合人对音频质量的感觉，缺点是费时费力费钱，且灵活性不够，重复性和稳定性较差，受人的主观影响较大等。

客观评测方法在语音方面：有ITU-T P.862(PESQ)建议，它是ITU提出的语音质量客观评价算法之一，它针对网络中出现的可变时间延迟和系统引入的线性滤波这两方面做了改进，是目前与主观分值相关度最高的语音质量评测客观算法，该分值在0~4.5之间，通常情况下，输出分值在1.0~4.5之间，分值在2分或2分以下，表示语音质量比较差，难于听懂，但是其对于音频和抖动延时较大的情况下却不能给出很好的评价；在VoIP中获得了广泛应用的ITU-T G.107规范(E模型)，其优点是全面考虑了网络中如噪声回音延时编码器性能抖动等网络损伤因素给出一个单一的得分R并且具有相当的评估准确度，且其质量等级R值与客观MOS分的质量等级存在着一个非线性单调的映射关系，然而E-model却存在着对于大数量的可能输入参数的组合情况未经过足够的界内验证和充分的实验室测量，估测仍处在置疑和研究的阶段等的缺点。在音频方面：ITU-R综合六种已有的方法以及一些还在发展中并且很有潜力的评价方法，最终形成了ITU-RBS.1387(PEAQ)建议，其客观评价分值称为ODG，分值范围为0到-4间，质量等级为：无法感知的(0分)，可感知但不恼人(-1分)，轻微的恼人(-2分)，恼人的(-3分)，非常恼人(-4分)，然而它作为针对音频编解码器的提出的算法，存在“训练集问题”，对于高速率及质量较好的音频能够给出很好的评价，然而，对于质量较差(如速率较低或者丢包率很高)则不能给出与主观分值相关度较高的评价。由于PEAQ是基于帧到帧的比较，因此对于引入了延时抖动的音频，PEAQ不能自己对齐音频，找到原始帧对应的失真帧进行比较，因此不能给出正确的客观评测分值。

发明内容

本发明要解决的技术问题是，提供一种针对流媒体音频质量的客观评测方法，能够客观评测引入了编解码器、丢包、噪声等损伤的音频质量，而且还能够客观评测引入了网络传输损伤(如延时抖动等)的失真音频的质量。

本发明提供的一种针对流媒体音频质量的客观评测方法，包括以下步骤：

第一步：在发送端获得原始音频，在接收端获得经过网络传输后引入了编解码器、丢包、延时抖动损伤的失真音频；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学，未经北京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910235645.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种针对流媒体音频质量的客观评测方法无效

专利文献下载