[发明专利]语音编码装置以及语音编码方法有效
申请号: | 200680035355.8 | 申请日: | 2006-09-29 |
公开(公告)号: | CN101273404A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | 押切正浩 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L21/04 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 编码 装置 以及 方法 | ||
技术领域
本发明涉及语音编码装置以及语音编码方法。
背景技术
为了有效地利用移动通信系统中的电波资源等,需要以低比特率压缩语音信号。
另一方面,又希望提高通话语音的质量以及实现较高临场感的通话服务。为了实现该目的,不仅需要语音信号的高质量,而且需要能够对语音信号以外的频带更宽的音频信号等信号高质量地进行编码。
对于这样相互矛盾的需求,将多个编码技术分层次地结合起来的研究将很有前途。具体而言,为将第一层和第二层分层次地组合的研究,所述第一层,以适合语音信号的模式用低比特率对输入信号进行编码,所述第二层,以也适合语音以外的信号的模式对输入信号与第一层解码信号的差分信号进行编码。这种分层结构的编码方式具有,即使废弃已编码的比特流的一部分也能够从剩余的信息获得解码信号的特征(可扩展性),因此被称为可扩展编码。由可扩展编码的这种特性,还可以灵活地应对比特率彼此不同的网络之间的通信。此外,可以说这种特征适合于通过IP协议将多种网络合并的将来的网络环境。
作为以往的可扩展编码,有使用由MPEG-4(Moving Picture Experts Groupphase-4运动图像专家组格式-4)标准化了的技术的编码(例如参照非专利文献1)。在非专利文献1记载的可扩展编码中,在第一层使用适合语音信号的CELP(Code Excited Linear Prediction:码激励线性预测),在第二层使用作为对从原有信号中减去第一层解码信号所获得的残差信号进行编码的AAC(Advanced Audio Coder:高级音频编码)或TwinVQ(Transform DomainWeighted Interleave Vector Quantization:传输域加权交织矢量量化)这样的变换编码。
另一方面,在变换编码中,存在对频谱高效率地进行编码的技术(例如参照专利文献1)。在专利文献1记载的技术中,将语音信号的频带划分为低频域和高频域两个子带,将低频域的频谱复制到高频域,并将复制后的频谱进行变形而使其成为高频域的频谱。此时,对变形信息以较少的比特数进行编码,从而能够实现低比特率。
非专利文献1:三木弼一编著,MPEG-4の全て,初版,(株)工業調查会,1998年9月30日,pp.126-127
专利文献1:日本专利申请特表2001-521648号公报
发明内容
发明需要解决的问题
一般地,语音信号或音频信号的频谱用随同频率缓慢地变化的分量(频谱包络)与细微地变化的分量(频谱细微结构)的乘积来表示。作为一个例子,图1表示语音信号的频谱,图2表示频谱包络,图3表示频谱细微结构。该频谱包络(图2)是使用10阶的LPC(Linear Prediction Coding:线性预测编码)系数计算出的频谱包络。从这些图可知,频谱包络(图2)与频谱细微结构(图3)的乘积成为语音信号的频谱(图1)。
这里,在对低频域的频谱进行复制而使其成为高频域的频谱的情况下,在复制目的地的高频域的带宽宽于复制源的低频域的带宽时,将低频域的频谱复制到高频域两次以上。例如,在从图1的低频域(0-FL)将频谱复制到高频域(FL-FH)的情况下,由于在该例中存在FH=2*FL的关系,所以需要将低频域的频谱复制到高频域两次。如图4所示,这样将低频域的频谱复制到高频域多次后,在复制目的地的频谱的连接部分产生频谱的能量的不连续。发生这样的不连续的原因在于频谱包络。如图2所示,在频谱包络中,频率上升的同时,能量衰减,所以在频谱产生斜率。由于存在这样的频谱的斜率,在将低频域的频谱复制到高频域多次后,发生频谱的能量的不连续,语音质量恶化。可通过增益调整对该不连续进行校正,但是为了通过增益调整而获得充分的效果,需要较多的比特数。
本发明的目的在于提供,即使在将低频域的频谱复制到高频域多次的情况下,也能够保持频谱的能量的连续性,并且防止语音质量的恶化的语音编码装置以及语音编码方法。
解决问题的方案
本发明的语音编码装置采用的结构包括:第一编码单元,对语音信号的低频域的频谱进行编码;平整单元,使用所述语音信号的LPC系数,对所述低频域的频谱进行平整;以及第二编码单元,使用平整后的低频域的频谱,对所述语音信号的高频域的频谱进行编码。
发明的有益效果
根据本发明能够保持频谱的能量的连续性,并且防止语音质量的恶化。
附图说明
图1是表示语音信号的频谱(以往)的图;
图2是表示频谱包络(以往)的图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680035355.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水溶性钙肥及其制备方法
- 下一篇:网络入侵事件关联检测方法