[发明专利]解码装置、解码方法、解码程序、记录介质在审
申请号: | 202110081890.3 | 申请日: | 2015-02-20 |
公开(公告)号: | CN112820304A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 守谷健弘;镰本优;原田登 | 申请(专利权)人: | 日本电信电话株式会社 |
主分类号: | G10L19/04 | 分类号: | G10L19/04;G10L19/02;G10L19/12;G10L19/06 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金兰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 装置 方法 程序 记录 介质 | ||
提供一种能够将在由音响信号的基音周期引起的峰值附近的近似精度高的频域的包络序列以较少的码量再现的解码装置、解码方法、解码程序、记录介质。本发明的解码装置具有周期性综合包络生成部和可变长度解码部。周期性综合包络生成部生成频域的序列的周期性综合包络序列,所述周期性综合包络序列基于与线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期。可变长度解码部对可变长度码进行解码而获得频域的序列。
本发明是以下专利申请的分案申请:申请号:201580022887.7,申请日:2015年02月20日,发明名称:编码装置、解码装置、编码方法、解码方法、记录介质。
技术领域
本发明涉及利用音响信号的谱包络对音响信号进行编码、解码的编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、以及记录介质。
背景技术
作为低比特(例如,10kbit/s~20kbit/s左右)的语音信号或音响信号的编码方法,已知DFT(离散傅里叶变换)或MDCT(改进离散余弦变换)等对于正交变换系数的自适应编码。例如在非专利文献1中利用的TCX(transform coded excitation:变换编码激励)编码方法中,求从作为被输入的音响信号在频域的表现的系数串X[1],…,X[N]去除了振幅谱包络的影响的序列(归一化序列串XN[1],…,XN[N]),并对其进行可变长度编码。其中,[]内的N是正整数。
振幅谱包络通过以下的步骤算出。
(步骤1)以作为规定的时间区间的帧为单位,进行对于被输入的时域的音响数字信号(以下,输入音响信号)的线性预测分析而求线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,在时刻t中的输入音响信号x(t)根据追溯至P时刻为止的过去的自身的值x(t-1),…,x(t-P)与预测残差e(t)以及线性预测系数α1,…,αp,通过式(1)来表示。
x(t)=α1x(t-1)+…+αp x(t-P)+e(t) (1)
(步骤2)对线性预测系数α1,…,αP进行量化,并求已量化线性预测系数^α1,…,^αP。利用已量化线性预测系数^α1,…,^αP求N点输入音响信号的振幅谱包络序列W[1],…,W[N]。例如,能够通过式(2)求振幅谱包络序列的各值W[n]。其中,n是1≦n≦N的整数,exp(·)是以纳皮尔数作为底数的指数函数,j是虚数单位,σ是预测残差信号的振幅。
另外,在本说明书中,在右上角没有方括号而标记的标号表示幂运算。也就是说,σ2表示σ的2次方。此外,在文中使用的标记“~”、“^”等本来应记载在其后的字符的正上方,但由于文本记载方法的限制,记载在了该字符的正前方。在公式中这些记号记载在本来的位置即字符的正上方。
现有技术文献
非专利文献
非专利文献1:Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.
发明内容
发明要解决的课题
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社,未经日本电信电话株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081890.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清洁机器人碰撞避让装置
- 下一篇:一种防脱发组合物及其制备方法