[发明专利]音频相似性评估器、音频编码器、方法和计算机程序在审
申请号: | 201980049602.7 | 申请日: | 2019-05-29 |
公开(公告)号: | CN112470220A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 萨沙·迪施;史蒂文·范·德·帕;安德烈·尼德迈尔;埃琳娜·伯迪埃尔·佩雷斯;贝恩德·埃德勒 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L19/22;G10L21/0388;G10L25/18 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 相似性 评估 编码器 方法 计算机 程序 | ||
音频相似性评估器基于输入的音频信号获得针对多个频率范围的包络信号。音频相似性评估器被配置为获得与针对多个调制频率范围的包络信号相关联的调制信息,其中,调制信息描述包络信号的调制。音频相似性评估器被配置为将所获得的调制信息和与参考音频信号相关联的参考调制信息进行比较,以便获得关于输入音频信号与参考音频信号之间的相似性的信息。音频编码器使用这种音频相似性评估器。另一音频相似性评估器使用利用音频相似性评估器训练的神经网络。
技术领域
根据本发明的实施例涉及音频相似性评估器。
根据本发明的进一步实施例涉及音频编码器。
根据本发明的进一步实施例涉及用于对音频信号之间相似性进行评估的方法。
根据本发明的进一步实施例涉及用于对音频信号进行编码的方法。
根据本发明的进一步实施例涉及用于执行所述方法的计算机程序。
一般来讲,根据本发明的实施例涉及用于有效的感知音频编解码器的改进的心理声学模型。
背景技术
音频编码是一个新兴的技术领域,因为音频内容的编码和解码在许多技术领域都很重要,例如移动通信、音频流、音频广播、电视等。
在下文中,将提供对感知编码的介绍。应当注意,以下讨论的定义和细节可以可选地结合本文公开的实施例应用。
感知编解码器
诸如mp3或AAC之类的感知音频编解码器已广泛用于在当今的多媒体应用中对音频进行编码[1]。最流行的编解码器是所谓的波形编码器,即,它们保留音频的时域波形,并且由于感知上受控制的量化应用,因此大多会增加(听不见的)噪声。量化通常可以在时频域中进行,但也可以在时域中应用[2]。为了使增加的噪声听不见,它是通过心理声学模型(通常是感知掩蔽模型)进行控制而成形的。
在现在的音频应用中,始终要求更低的比特率。传统上,感知音频编解码器限制音频带宽,以在这些低比特率下仍能达到良好的感知质量。高效的半参数技术,如高效高级音频编码(High Efficiency Advanced Audio Coding,HE-AAC)[4]中的谱带宽复制(Spectral Bandwidth Replication,SBR)[3]或MPEG-H 3D音频[6]中的智能空隙填充(Intelligent Gap Filling,IGF)[5],3gpp增强语音服务(Enhanced Voice Services,EVS)[7]用于在解码器侧将带宽受限的音频扩展直到全带宽。这种技术称为带宽扩展(Bandwidth Extension,BWE)。这些技术插入由几个参数控制的丢失高频含量的估计。通常,最重要的BWE侧信息是包络相关数据。通常,估计过程是由启发式方法而不是心理声学模型控制的。
感知模型
音频编码中使用的心理声学模型主要依赖于评估错误信号是否在感知上被要编码的原始音频信号掩蔽。当错误信号是由波形编码器中通常使用的量化过程引起时,此方法很有效。但是,对于参数信号表示形式(例如SBR或IGF),即使几乎听不到伪像,错误信号也会很大。
这是由于人类听觉系统无法处理音频信号的确切波形而导致的;在某些情况下,听觉系统对相位不敏感,频带的时间包络成为评估的主要听觉信息。例如,正弦曲线的不同起始相位(具有平滑的起始和偏移)不会产生明显的影响。然而,对于谐波复杂的音调,相对的起始相位在感知上很重要,特别是当多个谐波落入一个听觉临界频带内时[8]。这些谐波的相对相位及其幅度将影响在一个听觉临界频带内表示的时间包络形状,在原则上可以由人类听觉系统处理。
鉴于这种情况,需要一种概念来比较音频信号和/或决定编码参数,该概念在计算复杂度和感知相关性之间提供了改进的折衷,和/或首次允许在心理声学模型的控制下使用参数技术。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980049602.7/2.html,转载请声明来源钻瓜专利网。