[发明专利]语音编码装置和语音编码方法有效
申请号: | 200580045069.5 | 申请日: | 2005-12-26 |
公开(公告)号: | CN101091208A | 公开(公告)日: | 2007-12-19 |
发明(设计)人: | 吉田幸司;后藤道代 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/14 | 分类号: | G10L19/14 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 黄小临 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 编码 装置 方法 | ||
技术领域
本发明涉及语音编码装置和语音编码方法,特别涉及用于立体声语音的语音编码装置和语音编码方法。
背景技术
随着移动通信或IP通信中的传输频带的宽频化、服务的多样化,在语音通信中,对高质量化、高临场感化的需求提高。例如,预计今后电视电话服务中的免提(hands free)方式的通话、电视会议中的语音通信、多个通话者在多个地点同时进行会话的多地点语音通信、以及能够在保持临场感的同时传输周围的声音环境的语音通信等的需要会增加。在该情况下,期望实现比单声道信号有临场感,而且能够识别多个通话者的讲话位置的基于立体声语音的语音通信。为了实现这样的基于立体声语音的语音通信,必须将立体声语音编码。
此外,在IP网络上的语音数据通信中,为了实现网络上的通信量控制和组播通信,期望具有可伸缩(scalable)的结构的语音编码。可伸缩的结构是指在接收端即使由部分的编码数据也能够进行语音数据的解码的结构。
从而,期望具有在将立体声语音编码并传输的情况下也能够在接收端选择立体声信号的解码和使用了编码数据的一部分的单声道信号的解码的、单声道-立体声之间的可伸缩结构(单声道/立体声可伸缩结构)的编码。
作为这样的具有单声道/立体声可伸缩结构的语音编码方法,例如有通过声道相互间的音调(pitch)预测来进行声道(以下酌情简称为“ch”)之间的信号预测(从第一ch信号预测第二ch信号或从第二ch信号预测第一ch信号),即利用两个声道之间的相关来进行编码的方法(参照非专利文献1)。
非专利文献1:Ramprashad,S.A.,“Stereophonic CELP coding using crosschannel prediction”,Proc.IEEE Workshop on Speech Coding,pp.136-138,Sep.2000.
发明内容
但是,在上述非专利文献1记载的语音编码方法中,在两个声道之间的相关小的情况下,声道之间的预测的性能(预测增益(gain))降低,编码效率恶化。
本发明的目的在于提供一种在具有单声道/立体声可伸缩结构的语音编码中,即使在立体声信号的多个声道信号之间的相关小的情况下也能够高效率地将立体声语音编码的语音编码装置和语音编码方法。
本发明的语音编码装置,包括:第一编码部件,在核心层中进行单声道信号的编码;以及第二编码部件,在增强层中进行立体声信号的编码,所述第一编码部件具有生成部件,用于将包含第一声道信号和第二声道信号的立体声信号作为输入信号,由所述第一声道信号以及所述第二声道信号生成单声道信号,所述第二编码部件具有:合成部件,用于根据从所述单声道信号得到的信号,对所述第一声道信号或所述第二声道信号的预测信号进行合成;以及计算部件,用于由所述第一声道信号或所述第二声道信号计算第一声道线性预测编码残差信号或第二声道线性预测编码残差信号,其中,所述合成部件使用所述第一声道线性预测编码残差信号或所述第二声道线性预测编码残差信号相对于将所述单声道信号进行码激励线性预测(CELP:Code Excited Linear Prediction)编码而得到的单声道驱动音源信号的延迟差和振幅比,合成所述预测信号。
根据本发明,即使在立体声信号的多个声道信号之间的相关小的情况下也能够高效率地将立体声语音编码。
附图说明
图1是表示本发明的实施方式1的语音编码装置的结构的方框图。
图2是表示本发明的实施方式1的第一ch、第二ch预测信号合成部分的结构的方框图。
图3是表示本发明的实施方式1的第一ch、第二ch预测信号合成部分的结构的方框图。
图4是表示本发明的实施方式1的语音解码装置的结构的方框图。
图5是本发明的实施方式1的语音编码装置的动作说明图。
图6是本发明的实施方式1的语音编码装置的动作说明图。
图7是表示本发明的实施方式2的语音编码装置的结构的方框图。
图8是表示本发明的实施方式2的语音解码装置的结构的方框图。
图9是表示本发明的实施方式3的语音编码装置的结构的方框图。
图10是表示本发明的实施方式3的第一ch、第二chCELP编码部分的结构的方框图。
图11是表示本发明的实施方式3的语音解码装置的结构的方框图。
图12是表示本发明的实施方式3的第一ch、第二chCELP解码部分的结构的方框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580045069.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可变间隙填塞环及其促动方法
- 下一篇:触摸屏