[发明专利]编码装置和解码装置有效
申请号: | 200880113728.8 | 申请日: | 2008-10-31 |
公开(公告)号: | CN101842832A | 公开(公告)日: | 2010-09-22 |
发明(设计)人: | 钟海山;刘宗宪;钟国胜;吉田幸司 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02;G10L19/14 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 装置 解码 | ||
技术领域
本发明涉及使用声道间预测(ICP)实现可扩展的立体声语音编码的编码装置和解码装置。
背景技术
以往,语音编码(语音编解码)用于使用电话频带(200Hz~3.4kHz)的窄带语音的通信用途。单声道语音的窄带语音编解码广泛地使用于移动电话、远程会议设备和分组网络(例如,因特网)上的语音通信等通信用途。
实现更具有现场感的语音通信系统的步骤之一为从单声道语音表现向立体声语音表现的转移。宽带立体声语音通信提供更自然的音响环境。可扩展立体声语音编码是用于实现高音质且高可用性的语音通信的核心技术。
作为对立体声语音信号进行编码的一般方法之一,使用基于单声道语音的信号预测方法。也就是说,使用公知的单声道语音编解码器发送基本声道信号,并根据该基本声道信号,使用追加的信息和参数,预测左声道或右声道。在多数的应用中,选择混合了左声道信号和右声道信号的单声道信号作为基本声道信号。
作为对立体声信号进行编码的方法,已知ISC(Intensity Stereo Coding:强度立体声编码)、BCC(Binaural Cue Coding:双声道信号编码)以及ICP(Inter-Channel Prediction:声道间预测)等。这些参数性的立体声编码方式分别具有不同的优点和缺点,并分别适合于不同的声源(source materials)的编码。
在非专利文献1中公开了使用这些编码方法,并基于单声道信号预测立体声信号的技术。具体而言,合成构成立体声信号的声道信号例如左声道信号和右声道信号而获得单声道信号,并使用公知的语音编解码器对所获得的单声道信号进行编码/解码,进而使用预测参数并根据单声道信号,预测左声道与右声道之间的差信号(旁信号(side signal))。在这样的编码方法中,在编码侧使用具有时间依赖性的自适应滤波器使单声道信号与旁信号之间的关系模式化,并将对每个帧计算出的滤波系数发送到解码侧。在解码侧,通过对由单声道编解码器发送的高质量的单声道信号进行滤波,再次生成差信号,并根据再次生成的差信号和单声道信号,计算左声道信号和右声道信号。
另外,在非专利文献2中公开了被称为声道间相关消除(Cross-ChannelCorrelation Canceller)的编码方法,在ICP方式的编码方法中适用声道间相关消除的技术时,能够根据一方的声道预测另一方的声道。
另外,近年来,音频压缩技术迅速发展,其中,改进离散余弦变换(MDCT)方式成为高质量的音频编码中的主要方法(参照非专利文献3、非专利文献4)。
在使用适当的窗口(例如,正弦窗)时,MDCT适用于音频压缩而在听觉上不产生较大的问题。最近,MDCT在多模式变换预测编码(multimodetransform predictive coding)的范例(paradigm)中具有重要的作用。
所谓多模式变换预测编码是指,将语音编码的原理和音频编码的原理归纳为一个编码系统(非专利文献4)。但是,非专利文献4中的基于MDCT的编码结构和其应用被设计为仅对一个声道的信号进行编码,并使用不同的量化方式使不同的频域中的MDCT系数量化。
非专利文献1:Extended AMR Wideband Speech Codec(AMR-WB+):Transcoding functions,3GPP TS 26.290.
非专利文献2:S.Minami and O.Okada,“Stereophonic ADPCM voicecoding method,”in Proc.ICASSP’90,Apr.1990.
非专利文献3:Ye Wang and Miikka Vilermo,“The modified discrete cosinetransform:its implications for audio coding and error concealment,”in AES 22ndInternational Conference on Virtual,Synthetic and Entertainment,2002.
非专利文献4:Sean A.Ramprashad,“The multimode transform predictivecoding paradigm,”IEEE Tran.Speech and Audio Processing,vol.11,pp.117-129,Mar.2003.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880113728.8/2.html,转载请声明来源钻瓜专利网。