[发明专利]用于自适应多速率编解码器的改进方法和设备无效
申请号: | 201180074240.0 | 申请日: | 2011-10-18 |
公开(公告)号: | CN104025191A | 公开(公告)日: | 2014-09-03 |
发明(设计)人: | S.布鲁恩;J.邝;J.王;C.张;S.赵 | 申请(专利权)人: | 爱立信(中国)通信有限公司 |
主分类号: | G10L19/04 | 分类号: | G10L19/04 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 徐予红;汤春龙 |
地址: | 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自适应 速率 编解码器 改进 方法 设备 | ||
技术领域
本申请涉及对语音信号进行编码的方法、用于对语音信号进行编码的设备以及计算机可读介质。
背景技术
许多语音编解码器采用代码激励线性预测(CELP)的框架。CELP要求使用线性预测(LP)分析。在一些语音编解码器中,在当前帧的LP分析期间利用下一帧中的语音样本。来自下一帧的所涉及样本称作前瞻样本。因为编码器必须等待前瞻样本被创建并且到达处理器,所以在当前样本的编码之前,前瞻过程固有地创建至少与前瞻样本跨越的时间期(其称作前瞻期)同样长的延迟。
例如,自适应多速率(AMR)编码模式的编码方案是代数代码激励线性预测(ACELP)。
AMR窄带(AMR-NB)的取样率为每秒8000个样本。编码比特率取决于模式。当前使用的编码模式为:4.75、5.15、5.90、6.70、7.40、7.95、10.2和12.2千比特/秒。在AMR-NB中,短期过滤系数使用每帧的分析窗口内的高通过滤语音样本计算。分析窗口的长度为240个样本。
在12.2千比特/秒模式中,两个不对称窗口用来生成每帧的两组LP系数。没有使用下一帧的样本(不存在前瞻)。在其它模式中,只有单个不对称窗口用来生成单组LP系数,并且这个窗口具有40样本前瞻,其意味着5 ms前瞻期。
在AMR宽带(AMR-WB)中,取样率为每秒16000个样本,但是处理速率降低到每秒12800个样本。编码比特率取决于模式。当前使用的编码模式为6.60、8.85、12.65、14.25、15.85、18.25、19.85、23.05和23.85千比特/秒。在AMR-WB中,分析窗口的长度为384个样本。对于所有模式,单个不对称窗口用来生成单组LP系数。这个窗口具有64样本前瞻,其要求在每秒12800个样本的处理速率下的5 ms前瞻期。
在上述示例中使用包括一些前瞻样本的窗口,因为与没有前瞻的窗口相比,所产生的编码语音的质量得到显著改进。
在AMR-NB的LP模型中,在对帧(当前帧)进行编码时,必须分析随后的帧的前40个样本。类似地,在AMR-WB的LP模型中,在对当前帧进行编码时,必须检查下一帧的前64个样本。在两种情况下,前瞻期均为5 ms。这个前瞻期引起延迟,其增加总传送延迟。这类延迟使语音通信的服务质量降级,并且可降低系统容量。
因此,5 ms的前瞻期是编码语音质量与传送延迟之间的折衷。需要用于AMR编解码器以及用于一般使用前瞻样本的编解码器的改进方法和设备。
在3GPP技术规范26.090 v10.0.0中描述了AMR语音编解码器和转码功能,其通过引用结合到本文中。在3GPP TS 26.190 v 10.0.0中描述了自适应多速率宽带(AMR-WB)语音编解码器和相应转码功能,其通过引用结合到本文中。AMR的进一步描述能够见于Information Technology:Coding and Computing (ITCC),2004中发表的J.Makinen和J.Vainio的“Source signal based rate adaptation for GSM AMR speech codec”,其通过引用结合到本文中。关于线性预测的更多信息能够见于在IEEE ICASSP,Hong Kong,2003年4月中发表的W.C.Chu的“Gradient-Descent Based Window Optimization for Linear Prediction Analysis”,其通过引用结合到本文中。关于用于取样的窗口的更多信息能够见于在IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING,VOL. 11,NO. 6,2003年11月中发表的Wai C. Chu的“Window Optimization in Linear Prediction Analysis”。
发明内容
本文所述的方法和设备提供一种跳过前瞻期从而改进传送系统上的服务质量,而没有显著影响编码语音的质量的方式。这通过使用仍然要求前瞻样本的线性预测的取样窗口进行,而不是等待前瞻样本被创建并且到达处理器,前瞻样本从当前可用样本外推。外推样本替代线性预测分析中的前瞻样本。
已经发现本文所提供的方法和设备提供在使用不具有前瞻的取样窗口的系统上的显著改进的编码语音质量。
##权利要求## 采用斜体文本。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱立信(中国)通信有限公司,未经爱立信(中国)通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180074240.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种架空电缆X射线检测用射线防护装置
- 下一篇:PC功率监视