[发明专利]一种基于两层模型的多声道音频质量评价方法在审
申请号: | 201710228454.8 | 申请日: | 2017-04-10 |
公开(公告)号: | CN107170468A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 王晶;谢湘;刘继月;刘敏;费泽松 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L25/69 | 分类号: | G10L25/69;G10L25/60;G10L25/27;G10L19/008 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙)11639 | 代理人: | 唐华 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 多声道 音频 质量 评价 方法 | ||
1.一种基于两层模型的多声道音频质量评价方法,需要评价的多声道音频信号称为待测音频,原始无失真的多声道音频信号称为参考音频,其特征在于,包括:
将待测音频和参考音频输入到第一层的客观基本音质模型,通过计算得到客观基本音质得分的步骤;
将待测音频和参考音频输入到第一层的客观空间质量模型,通过计算得到客观空间质量得分的步骤;以及
将所述基本音质得分和空间质量得分输入第二层的整体客观模型,输出待测音频的整体客观分数的步骤。
2.如权利要求1所述的一种基于两层模型的多声道音频质量评价方法,其特征在于:所述的客观基本音质模型、客观空间质量模型和整体客观模型都是由主观听音测试结果训练得到的。
3.如权利要求2所述的一种基于两层模型的多声道音频质量评价方法,其特征在于:由所述主观听音测试得到的主观质量评分,作为客观基本音质模型、客观空间质量模型和整体客观模型的训练集和测试集。
4.如权利要求2所述的一种基于两层模型的多声道音频质量评价方法,其特征在于:所述主观听音测试采用带隐藏参考和基准的多激励测试法或者带隐藏参考的三次听音双盲听评法。
5.如权利要求2所述的一种基于两层模型的多声道音频质量评价方法,其特征在于:在所述的主观听音测试训练中,对训练音频进行评分的指标包括:
基本音质:代表多声道音频综合每一路声道信号基础音质的感受;
空间质量:代表多声道音频信号的在空间范围内的扩散和环绕感;以及
整体质量:代表多声道音频信号在基本音质和空间质量上的综合感受。
6.如权利要求1~5中任一权利要求所述的一种基于两层模型的多声道音频质量评价方法,其特征在于,所述的客观基本音质模型构建过程为:首先将训练所用的多声道音频信号经过PEAQ算法计算出每一个声道的音质得分,然后利用数据拟合工具将其拟合到对应的主观音质得分,从而得到客观基本音质模型;所述数据拟合工具优选采用多元线性回归方法。
7.如权利要求1~5中任一权利要求所述的一种基于两层模型的多声道音频质量评价方法,其特征在于,所述的客观空间质量模型构建过程为:通过计算每两个声道之间的空间参数,来获得待测音频的空间信息,在得到待测音频的声道间空间参数后,利用数据拟合工具将空间参数拟合到对应的主观空间质量得分,从而得到客观空间质量模型;所述数据拟合工具优选采用神经网络方法。
8.如权利要求1~5中任一权利要求所述的一种基于两层模型的多声道音频质量评价方法,其特征在于,所述的整体客观模型构建过程为:输入所述第一层的客观基本音质模型输出的客观基本音质得分和客观空间质量模型输出的客观空间质量得分,通过数据拟合工具与主观整体质量得分进行拟合,从而获得整体客观模型;所述数据拟合工具优选采用多元线性回归方法。
9.如权利要求7所述的一种基于两层模型的多声道音频质量评价方法,其特征在于,所述的空间参数包括:
声道间相位差
声道间强度差
声道间相干性
其中,Ab是在子带b中的频谱系数的个数,A1(k)表示输入音频中一个声道的频谱系数,A2(k)表示输入音频另一个声道的频谱系数,*表示取共轭。
10.如权利要求7所述的一种基于两层模型的多声道音频质量评价方法,其特征在于,所述的空间信息获取过程为:选取四组声道对,即FL-FR,BL-BR,FC-FL和FC-FR,计算每一组声道对中两两声道间的空间参数的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710228454.8/1.html,转载请声明来源钻瓜专利网。