[发明专利]固定码本搜索装置有效
申请号: | 201110187579.3 | 申请日: | 2007-03-08 |
公开(公告)号: | CN102194461A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 江原宏幸;吉田幸司 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/10 | 分类号: | G10L19/10 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 固定 搜索 装置 | ||
本申请是申请日为2007年3月8日、申请号为200780002877.2、发明名称为“固定码本搜索装置以及固定码本搜索方法”的发明专利申请的分案申请。
技术领域
本发明涉及固定码本搜索装置以及固定码本搜索方法,用于通过码激励线性预测(Code Excited Linear Prediction:CELP)型的语音编码装置对语音信号进行编码。
背景技术
在语音编码处理中,一般而言CELP型语音编码装置中的固定码本的搜索处理在处理量中占得最多,因此以往就开发了各种各样的固定码本的结构和固定码本的搜索方法。
作为比较能够减少用于搜索的处理量的固定码本,可举出在ITU-T建议G.729和G.723.1,或者3GPP标准AMR等国际标准编解码(codec)中被广泛采用的利用了代数码本(Algebraic Codebook)的固定码本(Fixed Codebook)(参照例如非专利文献1至3)。利用这些固定码本,通过稀疏(sparse)根据代数码本生成的脉冲数,能够减少固定码本搜索所需的处理量。另一方面,可利用稀疏的脉冲声源表现的信号特性有限,因此有时在编码质量上发生问题。为了对应这样的问题,提出了为使根据代数码本生成的脉冲声源具有特性而使其通过滤波器的方法(参照例如非专利文献4)。
【非专利文献1】ITU-T Recommendation G.729,“Coding of Speech at 8kbit/s using Conjugate-structure Algebraic-Code-Excited Lineare-Prediction (CS-ACELP)”,1996年3月
【非专利文献2】ITU-T Recommendation G.723.1,“Dual Rate Speech Coder for Multimedia Communications Transmitting at 5.3 and 6.3kbit/s”,1996年3月
【非专利文献3】3GPP TS 26.090、“AMR speech codec;Transcoding functions”V4.0.0,2001年3月
【非专利文献4】R.Hagen等,“Removal of sparse-excitation artifacts in CELP”and IEEE ICASSP‘98,pp.145~148,1998
发明内容
发明所要解决的课题
但是,在声源脉冲所通过的滤波器无法用下三角特普利茨(Toeplitz)矩阵表现时(例如,在非专利文献4那样的循环卷积处理时等,为在负的时间具有值的滤波器的情况下),在矩阵运算中需要额外的存储器和运算量。
本发明的目的在于提供语音编码装置等,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而能够实现次优的固定码本搜索。
用于解决课题的手段
本发明通过固定码本搜索装置具有以下单元来达到上述目的:脉冲声源矢量生成单元,生成脉冲声源矢量;第一卷积运算单元,向在负的时间具有值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,从而生成在负的时间具有值的第二脉冲响应矢量;矩阵生成单元,利用由所述第一卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵;以及搜索单元,利用由所述矩阵生成单元生成的矩阵,对由所述脉冲声源矢量生成单元生成的脉冲声源矢量进行卷积处理,并搜索使经所述卷积处理得到的听觉加权合成信号与根据输入语音信号得到的对象信号之间的误差成为最小的脉冲声源矢量,以确定用于生成搜索出的脉冲声源矢量的编码索引。
另外,本发明通过具有固定码本搜索方法来达到上述目的,该固定码本搜索方法包括:脉冲声源矢量生成步骤,生成脉冲声源矢量;第一卷积运算步骤,在负的时间具有值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,从而生成在负的时间具有值的第二脉冲响应矢量;矩阵生成步骤,利用在所述第一卷积运算步骤中生成的第二脉冲响应矢量,生成特普利茨型的卷积矩阵;以及搜索步骤,利用所述特普利茨型的卷积矩阵,对所述脉冲声源矢量进行卷积处理,并搜索使经所述卷积处理得到的听觉加权合成信号与根据输入语音信号得到的对象信号之间的误差成为最小的脉冲声源矢量,以确定用于生成搜索出的脉冲声源矢量的编码索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110187579.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:完全平衡双沟道内存单元
- 下一篇:用于生成定制歌曲的系统和方法