[发明专利]一种无参考源的MP3音频清晰度客观评价方法无效
申请号: | 201010215600.1 | 申请日: | 2010-06-29 |
公开(公告)号: | CN101894560A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 余小清;张静;石成林;刘军伟;万旺根 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 参考 mp3 音频 清晰度 客观 评价 方法 | ||
技术领域
本发明涉及音频质量客观评价,特别是一种对无参考源MP3(MPEG1-layer3)音频的清晰度客观评价方法。
背景技术
本发明一种无参考源的音频清晰度客观评价技术是直接对音频系统输出信号的清晰度质量在0-5区间进行分值评判。
音频质量客观评价,从评价结构上可分为基于输入-输出的评价和基于输出的评价。其中大部分工作集中在基于输入-输出的评价,它是以语音系统的输入信号和输出信号之间的误差大小来判别语音质量的好坏,是一种误差度量;而基于输出的评价是仅根据语音系统的输出信号来进行质量评价,无参考源;另一方面,从评价内容上可分为对音频整体的综合评价及分指标(如:清晰度、丰满度、明亮度、柔和度等)进行评价。基于输入-输出的音频质量客观评价方法目前比较完善,基于输出的评价方面起步较晚且在评价内容方面基本上是针对音频总体质量进行评价,主要有感知线性预测方法、基于模糊多类支持向量机的评价方法、度量语谱图密度分布特征的方法等。目前还没有涉及到对输出信号分指标进行质量评价的方法,本发明正是研究对无参考源MP3音频信号的清晰度指标进行客观评价。
本发明所提出的无参考源的音频清晰度客观评价方法,改善了主观评价费时、费力及成本高的缺点,同时还解决了目前占据优势地位的基于输入-输出客观评价方法有时难以提供参考信号的不利因素,可进一步为音频丰满度、明亮度等其它指标的客观评价提供参考,同时也可将各项指标作为高层感知参数,用于MP3压缩域的语音识别与分类检索中。
发明内容
本发明的目的在于提供一种无参考源的MP3音频清晰度客观评价方法,提供最佳音频清晰度质量的判据。从MP3压缩数据中直接提取反映音频清晰度的特征参数-中高频指数(MHFI),并计算MHFI的可能性熵值,通过对熵值进行统计映射,将待测音频清晰度的分值限定在0-5分之间,实现对无参考源音频清晰度指标的客观评价。
本发明解决其技术问题采用的技术方案为:先从MP3压缩音频数据中提取中高频指数,计算中高频指数的可能性熵值,通过统计映射得到待测音频清晰度的分值。
本发明解决其技术问题所采用的技术方案还可以进一步完善。首先从MP3压缩音频数据中生成修正离散余弦变换MDCT(Modified Discrete Cosine Transform)矩阵,再从中提取有效的特征参数:中高频指数,计算中高频指数的可能性熵值,通过对熵值进行统计映射,将待测音频清晰度的分值限定在0-5分之间,实现对无参考源音频清晰度指标的客观评价。该方法具体包括如下步骤:
1)MP3压缩音频的预处理:包括对解码帧头,边信息读取,主数据读取,哈夫曼解码和量化四个部分;
2)生成MDCT矩阵:找出每一子带中的MDCT系数,对子带中系数排列,形成矩阵三部分;
3)压缩域特征参数的提取:中高频指数MHFI(Medium-high frequency index);
4)计算中高频指数的可能性熵(E):
5)统计映射:将计算所得的中高频指数可能性熵值进行统计,将其映射至0-5区间并输出。
本发明有益的效果是:直接从MP3压缩音频数据中提取有效的特征参数,比将压缩数据解压后再提取特征,既算法更简单,又节省计算时间;弥补了主观评价费时、费力及成本高等缺陷,同时还解决了目前占据优势地位的基于输入-输出客观评价方法有时难以提供参考信号的不利因素,可进一步为音频丰满度、明亮度等其它指标的客观评价提供参考,同时也可将各项指标作为高层感知参数,用于MP3压缩域的语音识别与检索中。
附图说明
图1是本发明一种无参考源的MP3音频清晰度客观评价方法的流程图。
图2是主、客观评价分值的对比图。
具体实施方式
本发明的一个优选实例结合附图1说明如下:本无参考源的MP3音频清晰度客观评价方法,共分五步:
第一步:MP3压缩域音频数据处理
压缩域音频数据处理可分为:帧头信息读取,边信息的读取,主数据读取,哈夫曼解码和量化。
1)帧头信息读取
a)定义存放帧头信息的结构体;
b)读取帧中同步信息;
c)使解码器与数据流同步;
d)确定该帧数据起始位置,存放帧头信息;
2)边信息的读取
a)定义存放边信息的结构体;
b)由帧头结束位置确定边信息开始位置;
c)存放边信息;
3)主数据读取
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010215600.1/2.html,转载请声明来源钻瓜专利网。