[发明专利]编码装置以及编码方法有效
申请号: | 201210096241.1 | 申请日: | 2008-02-29 |
公开(公告)号: | CN102682778A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 森井利幸;押切正浩;山梨智史 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 装置 以及 方法 | ||
本申请是申请日为2008年2月29日、申请号为20080006405.9、发明名称为“编码装置以及编码方法”的发明专利申请的分案申请。
技术领域
本发明涉及对语音信号和音频信号进行编码的编码装置以及编码方法。
背景技术
在移动通信中,为了实现电波等的传输路径容量和记录媒体的有效利用,必须对语音和图像的数字信息进行压缩编码,至今为止开发了诸多编码/解码方式。
其中,语音编码技术通过CELP(Code Excited Linear Prediction,码激励线性预测)而大幅提高了其性能,该CELP为对语音的发声机构进行模式化并巧妙地应用矢量量化的基本方式。另外,音频编码等音乐编码技术通过变换编码技术(MPEG标准ACC和MP3等)而大幅提高了其性能。
像CELP那样的语音信号的编码中,使用激励和合成滤波器表示语音信号的情况较多,如果通过解码能够获得其形状类似于作为时序矢量的激励信号的矢量,则能够通过合成滤波器获得与输入语音近似到一定程度的波形,获得听觉上也良好的音质。这是与CELP中使用的代数码本的成功也有关的定性性质。
另一方面,通过ITU-T(International Telecommunication Union-Telecommunication Standardization Sector,国际电信联盟-电信标准化分部)等进行标准化的可扩展编解码中的规格覆盖从以往的语音频带(300Hz~3.4kHz)直到宽带(~7kHz),比特速率也设定了直到32kbps程度的高速率。因此,宽带的编解码中需要对音乐也进行一定程度的编码,所以,仅通过如CELP那样的、基于人的发声模式的以往的低比特速率语音编码方法,无法对应。因此,在以往推荐的ITU-T标准G.729.1中,对宽带以上的语音的编码采用了音频编解码的编码方式的变换编码。
专利文献1示出了,在对使用谱参数和音调参数(pitch parameter)的频谱(frequency spectrum)的编码方式中,对用谱参数使语音信号通过逆滤波器所得的信号进行正交变换,从而进行编码的技术,以及作为该编码的例子,通过代数结构的码本进行编码的方法。
[专利文献1]日本专利申请特开平10-260698号公报
发明内容
发明要解决的问题
然而,以往的频谱的编码方式中,将有限的比特信息较多地分配给脉冲的位置信息,而不分配给脉冲的振幅信息,并将所有脉冲的振幅设为一定,所以残留编码失真。
本发明的目的为提供编码装置和编码方法,在频谱的编码方式中,能够比以前减少平均的编码失真,并能够获得听觉上良好的音质。
解决问题的方案
本发明的编码装置为以多个固定波形对频谱进行模式化后进行编码的编码装置,该编码装置采用的结构包括:形状量化单元,检索所述固定波形的位置和极性,进行编码;以及增益量化单元,对所述固定波形的增益进行编码,所述形状量化单元在检索所述固定波形的位置时,将在后检索的固定波形的振幅设定为在前检索出的固定波形的振幅以下。
本发明的编码方法为以多个固定波形对频谱进行模式化后进行编码的编码方法,该编码方法包括:形状量化步骤,检索所述固定波形的位置和极性,进行编码;以及增益量化步骤,对所述固定波形的增益进行编码,在所述形状量化步骤中检索所述固定波形的位置时,将在后检索的固定波形的振幅设定为在前检索出的固定波形的振幅以下。
本发明的编码装置对语音信号进行第一编码得到残差分量,对该残差分量使用MDCT(modified discrete consine transform)进行正交变换,对经该正交变换所得的频谱使用多个脉冲进行模式化后进行第二编码,该编码装置包括:形状量化单元,检索N个振幅为1的脉冲、M个振幅为0.8的脉冲,并对所述N个振幅为1的脉冲和所述M个振幅为0.8的脉冲的、位置和极性进行编码;以及增益量化单元,基于所述频谱、所述N个振幅为1的脉冲和所述M个振幅为0.8的脉冲,对增益进行编码,其中,N、M为自然数。
本发明的编码方法对语音信号进行第一编码得到残差分量,对该残差分量使用MDCT进行正交变换,对经该正交变换所得的频谱使用多个脉冲进行模式化后进行第二编码,该编码方法包括以下步骤:检索N个振幅为1的脉冲、M个振幅为0.8的脉冲,并对所述N个振幅为1的脉冲和所述M个振幅为0.8的脉冲的、位置和极性进行编码;以及基于所述频谱、所述N个振幅为1的脉冲和所述M个振幅为0.8的脉冲,对增益进行编码,其中,N、M为自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210096241.1/2.html,转载请声明来源钻瓜专利网。