[发明专利]用于对音频信号进行编码的编码模型的选择有效
申请号: | 200580015656.X | 申请日: | 2005-04-06 |
公开(公告)号: | CN101091108A | 公开(公告)日: | 2007-12-19 |
发明(设计)人: | 雅里·马基南 | 申请(专利权)人: | 诺基亚公司 |
主分类号: | G01L19/14 | 分类号: | G01L19/14 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 冯谱 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 信号 进行 编码 模型 选择 | ||
技术领域
本发明涉及用于选择对音频信号的连续部分进行编码的各编码模型的方法,其中为第一种类型的音频内容优化的至少一个编码模型和为第二种类型的音频内容优化的至少一个编码模型可用于选择。本发明同样涉及对应的模块,涉及包含编码器的电子设备并涉及包含编码器和解码器的音频编码系统。最后,本发明还涉及对应的软件程序产品。
背景技术
对音频信号进行编码以便有效传输和/或存储音频信号是众所周知的。
音频信号可以是语音信号或诸如音乐的另一种类型的音频信号,并且对于不同类型的音频信号,不同的编码模型可能是适合的。
广泛使用的对语音信号进行编码的技术是代数编码激励线性预测(ACELP)编码。ACELP模拟人的语音产生系统,并且非常适合于对语音信号的周期进行编码。因此,可以用非常低的比特率获得高的语音质量。例如,自适应多速率宽带(AMR-WB)是基于ACELP技术的语音编解码器。有关AMR-WB的描述例如可以参阅技术规范3GPP TS 26.190:“Speech Codec speech processing functions;AMRWideband speech codec;Transcoding functions”,V5.1.0(2001-12)。然而,基于人的语音产生系统的语音编解码器通常对例如音乐的其它类型的音频信号的表现相当差。
广泛使用的用于对不同于语音的音频信号进行编码的技术是变换编码(TCX)。用于音频信号的变换编码的优越性是基于知觉掩蔽和频域编码的。通过为变换编码选择适合的编码帧长度,可以进一步改善最后得到的音频信号的质量。但是尽管变换编码技术导致对于不同于语音的音频信号的高质量,但是,对于周期性的语音信号,其性能并不好。因此,变换编码的语音的质量通常相当低,特别是用长TCX帧长度时。
扩展AMR-WB(AMR-WB+)编解码器将立体声音频信号编码为高比特率的单声道信号,并且提供用于立体声扩展的辅助信息。AMR-WB+编解码器同时使用ACELP编码和TCX模型对0Hz到6400Hz的频带内的核心单声道信号进行编码。对于TCX模型,使用20ms、40ms或80ms的编码帧长度。
因为ACELP模型可能使音频质量降级,并且变换编码通常对语音的表现不佳,特别是在使用长编码帧时,所以必须根据要编码的信号的性质选择各自的最好的编码模型。可以用不同方式实现要实际使用的编码模型的选择。
在例如移动多媒体业务(MMS)的需要低复杂性技术的系统中,通常使用音乐/语音分类算法选择最佳的编码模型。这些算法基于对音频信号的能量和频率性质的分析,把全部源信号分类为音乐或语音。
如果音频信号仅由语音或仅由音乐组成,则基于此种音乐/语音分类对全部信号使用相同的编码模型是令人满意的。然而,在许多其它情况中,要编码的音频信号是混合类型的音频信号。例如,语音可以与音乐同时出现和/或在时间上与音频信号中的音乐交错。
在这些情况中,把全部源信号分类成音乐或语音类别是一种非常局限的方法。因此,在对音频信号编码时,只有通过编码模型之间的瞬时切换,才能使总的音频质量最大化。亦即,最好部分地使用ACELP模型对被分类为不同于语音的音频信号的源信号进行编码,同时最好部分地使用TCX模型对被分类为语音信号的源信号进行编码。从编码模型的观点看,可以把信号称为类似语音的信号或类似音乐的信号。依据信号的性质,或者ACELP编码模型或者TCX模型具有更好的性能。
扩展AMR-WB(AMR-WB+)编解码器被设计用来以逐帧为基础利用混合编码模型对此种混合类型的音频信号进行编码。
可以用几种方式实现AMR-WB+中的编码模型的选择。
在最复杂的方法中,首先用ACELP和TCX模型的所有可能组合对该信号进行编码。接着,针对每种组合再次合成该信号。然后基于合成的语音信号的质量选择最好的激励。例如,通过确定其信噪比(SNR),可以测量以具体组合得到的合成语音的质量。这种综合分析类型的方法将提供好的结果。然而,在某些应用中,它是不可行的,因为它具有非常高的复杂性。此类应用包括例如移动应用。复杂性主要是由ACELP编码产生的,ACELP编码是编码器的最复杂的部分。
例如,在类似MMS的系统中,全闭环综合分析方法太复杂以至于不能执行。因此,在MMS编码器中,使用低复杂度的开环方法确定是选择ACELP编码模型还是选择TCX模型对特定帧进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580015656.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:镍氢电池的充电装置
- 下一篇:玻璃纤维防腐蚀加强型湿法增强无机玻璃钢工艺