[发明专利]语音编码装置以及频谱变形方法有效
申请号: | 200680016432.5 | 申请日: | 2006-05-11 |
公开(公告)号: | CN101176147A | 公开(公告)日: | 2008-05-07 |
发明(设计)人: | 张峻伟;梁世丰;吉田幸司;后藤道代 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 编码 装置 以及 频谱 变形 方法 | ||
技术领域
本发明涉及语音编码装置以及频谱变形方法。
背景技术
对单声道语音信号进行编码的语音编码技术现在已经成为标准。在信号来自例如人的话音等的单一音源的移动电话和电话会议机器等通信机器中,通常使用像这样的单声道编码。
以往由于发送信号的带宽和DSP的处理速度等原因,局限于这样的单声道信号。然而,随着技术的进步及带宽的改善,该限制的重要性逐渐消失。另一方面,语音的质量变成更应考虑的重要因素。单声道语音的缺点之一为不提供诸如立体的音感或说话人的位置等的空间信息。因此,今后为了实现更好的话音,应考虑以尽可能低的比特速率达成音质良好的立体声语音。
对立体声语音信号进行编码的一种方法为利用信号的预测或其估计技术。也就是说,对一方的声道,使用众所周知的音频编码技术进行编码,而对另一方的声道,使用通过对该声道进行分析或者从该声道提取而得到的一些辅助信息(side information),基于已经编码过的声道进行预测或估计。
这样的方法作为双耳标系统(binaural cue coding system,例如,参见非专利文献1)的一部分,在专利文献1中记述了有关该方法的记载。在该记载中,该方法适用于声道间电平差(ILD:interchannel level difference)的计算,计算所述声道间电平差的目的是以参考声道为基准对一方的声道的电平进行调整。
与原音相比,所预测或所估计的信号往往不忠实。因此,需要对所预测或所估计的信号进行增强(enhancement),以便尽可能地使其类似于原来的信号。
一般而言,在频域对音频信号和语音信号进行处理。一般将该频域数据称为“变换后的区域中的谱系数”。因此,能够在频域进行如上的预测及估计方法。例如,对于L声道和R声道的谱数据,能通过提取其辅助信息中的某些信息而将该信息适用于单声道的声道,来进行估计(参照专利文献1)。其它变形例子中还包括正如能基于R声道估计L声道那样,基于一方的声道估计另一方的声道的技术等。
作为适用音频处理和语音处理中的增强的一个区域,有频谱能量估计。频谱能量估计也被称为“频谱能量预测”或“定标(scaling)”。在典型的频谱能量估计运算中,将时域信号变换为频域信号。通常,对该频域信号与临界频带匹配地区分(partition)为多个频带。对参考声道和所估计的声道的双方进行该处理。对双方的声道的各个频带计算能量,并使用两个声道的能量比例,计算定标因子(scale factor)。将该定标因子发送到接收装置,并且在该接收装置中,使用该定标因子对参考信号进行定标,从而得到对各个频带的变换后的区域中的估计信号。然后,进行频率逆变换处理,得到相当于估计变换区域谱数据的时域信号。
专利文献1:国际公开第03/090208号小册子(pamphlet)
非专利文献1:C.Faller and F.Baumgarte,“Binaural cue coding:A noveland efficient representation of spatial audio”,Proc.ICASSP,Orlando,Florida,Oct.2002.
发明内容
发明要解决的问题
图1表示驱动音源信号的频谱(驱动音源谱)的一例。该频率谱为表示周期性的峰值的、具有周期性和恒定性的频谱。另外,图2是表示基于临界频带的分区化的例子的图。
在以往的方法中,将图2所示的频域的谱系数分割为多个临界频带,并计算能量和定标因子。在对非驱动音源信号的处理中通常使用该方法,但是由于驱动音源谱中出现重复图案(repetitive pattern),所以该方法并不适合于驱动音源信号。这里,非驱动音源信号意味着在用于生成驱动音源信号的LPC分析等的信号处理中的信号。
如上所述,在图2所示的基于临界频带的分区化中,由于各个频带的带宽不均等,所以通过将驱动音源谱单纯地分割为临界频带无法计算高精度地表示驱动音源谱的各个峰值的上升和下降的定标因子。
因此,本发明的目的为,提供语音编码装置和频谱变形方法,能够提高信号估计和预测的效率而有高效率地表现频谱。
解决问题的方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680016432.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:等离子体显示器、控制装置及驱动方法
- 下一篇:一种模壳构件成型模具